场景识别的GIST图像描述符
项目描述
计算GIST全局图像描述符的库,用于根据图片内容进行比较(用于全局场景识别和分类)。
GIST图像描述符的理论定义可以在A. Torralba的页面找到:http://people.csail.mit.edu/torralba/code/spatialenvelope/
C实现的源代码包含在lear_gist子文件夹中。有关原始项目信息,请参阅http://lear.inrialpes.fr/software。
pyleargist遵循GPL许可证,与原始C项目相同的许可证。
安装
安装libfftw3(开发头文件)(http://www.fftw.org)、python开发头文件、gcc、Python Imaging Library (PIL)和numpy。
本地构建以进行测试
% python setup.py buid_ext -i % export PYTHONPATH=`pwd`/src
全局构建和安装
% python setup.py build % sudo python setup.py install
用法
以下是在Python shell中安装库后的一个示例会话
>>> from PIL import Image >>> import leargist >>> im = Image.open('lear_gist/ar.ppm') >>> descriptors = leargist.color_gist(im) >>> descriptors.shape (960,) >>> descriptors.dtype dtype('float32') >>> descriptors[:4] array([ 0.05786307, 0.19255637, 0.09331483, 0.06622448], dtype=float32)
GIST描述符(默认大小为960,固定大小)可以用作欧几里得空间,根据内容对图像进行聚类。
然后可以使用局部敏感哈希、频谱哈希或堆叠去噪自动编码器将此维度降低到32或64位语义哈希。
使用SDA的图片语义哈希的示例实现已在libsgd库中展示:http://code.oliviergrisel.name/libsgd
变更
1.1.0: 2010/03/25 - 修复段错误漏洞,感谢S. Campion
1.0.1: 2009/10/10 - 添加缺失的MANIFEST
1.0.0: 2009/10/10 - 初始发布
项目详情
关闭
pyleargist-2.0.5.tar.gz的散列值
算法 | 散列摘要 | |
---|---|---|
SHA256 | 212d932d756799071bb31daa6c03457e65238d461fa15598d6f849be0adac8ec |
|
MD5 | 00b7fa75cf84687db282dd018d0118b3 |
|
BLAKE2b-256 | f74a2eef58a73c48aec6aca09254ef0f39148fd39b8dc7ec96d6b39d513b03eb |