跳转到主要内容

场景识别的GIST图像描述符

项目描述

作者:

<olivier.grisel@ensta.org>

计算GIST全局图像描述符的库,用于根据图片内容进行比较(用于全局场景识别和分类)。

GIST图像描述符的理论定义可以在A. Torralba的页面找到:http://people.csail.mit.edu/torralba/code/spatialenvelope/

C实现的源代码包含在lear_gist子文件夹中。有关原始项目信息,请参阅http://lear.inrialpes.fr/software

pyleargist遵循GPL许可证,与原始C项目相同的许可证。

安装

安装libfftw3(开发头文件)(http://www.fftw.org)、python开发头文件、gcc、Python Imaging Library (PIL)和numpy。

本地构建以进行测试

% python setup.py buid_ext -i
% export PYTHONPATH=`pwd`/src

全局构建和安装

% python setup.py build
% sudo python setup.py install

用法

以下是在Python shell中安装库后的一个示例会话

>>> from PIL import Image
>>> import leargist

>>> im = Image.open('lear_gist/ar.ppm')
>>> descriptors = leargist.color_gist(im)

>>> descriptors.shape
(960,)

>>> descriptors.dtype
dtype('float32')

>>> descriptors[:4]
array([ 0.05786307,  0.19255637,  0.09331483,  0.06622448], dtype=float32)

GIST描述符(默认大小为960,固定大小)可以用作欧几里得空间,根据内容对图像进行聚类。

然后可以使用局部敏感哈希、频谱哈希或堆叠去噪自动编码器将此维度降低到32或64位语义哈希。

使用SDA的图片语义哈希的示例实现已在libsgd库中展示:http://code.oliviergrisel.name/libsgd

变更

  • 1.1.0: 2010/03/25 - 修复段错误漏洞,感谢S. Campion

  • 1.0.1: 2009/10/10 - 添加缺失的MANIFEST

  • 1.0.0: 2009/10/10 - 初始发布

项目详情


下载文件

下载适合您平台的文件。如果您不确定选择哪个,请了解更多关于安装包的信息。

源代码分布

pyleargist-2.0.5.tar.gz (26.4 kB 查看散列值)

上传时间 源代码

支持