跳转到主要内容

通过外观而不是内容比较两个PDF文件。

项目描述

版本

下载

测试

覆盖率

Latest PyPI version

Number of PyPI downloads

Travis results

Coveralls results_

通过外观而不是内容比较两个PDF文件。它可以在命令行中使用,以便在更大的脚本中使用。

安装

它需要一些库。在Debian或Ubuntu中,您可以使用apt安装它们

# apt-get install libpoppler-glib-dev python-gtk2 python-cairo-dev python-gobject-dev python-gobject

确保您有实际的gcc版本,因为pycairo将需要它(它将添加选项-fstack-protector-strong到编译选项)。这个库很难安装,所以这里是我使用的命令行

$ pip install pycairo==1.8.8 –allow-unverified pycairo –allow-external pycairo

然后您可以像平常一样安装它

$ pip install pdfcomparator

用法

格式如下

$ pdfcompare.py pattern current

它将比较“pattern”和“current”下的文件。

如果它们相等,将不打印任何内容。如果它们不同,将打印不同的第一页,并且脚本将返回2。

相似度

通常,两页是相等或不等的。但也许您只需要一个相似度百分比。因此,您可以使用百分比。通常,这会使比较变慢。

因此,它将使用不同的算法来检查更高的相似度比率。如果任何一个失败,整个比较都会失败。

您可以通过使用选项–precise启用精确算法,并使用–ratio=0.8设置相似度比率,使用介于0和1之间的任何数字。

享受它!

贡献

如果您想贡献,请创建一个VirtualEnv环境

$ virtualenv venv --system-site-packages
$ . venv/bin/activate

使用系统包是为了找到python-gobject库,这是很重要的。

现在,您应该能够安装pdfcomparator包

$ python setup.py develop

并且测试它

$ python setup.py test

项目详情


下载文件

下载适合您平台的文件。如果您不确定选择哪一个,请了解更多关于安装包的信息。

源分布

pdfcomparator-0.3.0.tar.gz (4.9 kB 查看哈希值)

上传时间

构建分布

pdfcomparator-0.3.0-py2-none-any.whl (7.1 kB 查看哈希值)

上传时间 Python 2

由以下支持