通过外观而不是内容比较两个PDF文件。
项目描述
版本 |
下载 |
测试 |
覆盖率 |
---|---|---|---|
通过外观而不是内容比较两个PDF文件。它可以在命令行中使用,以便在更大的脚本中使用。
安装
它需要一些库。在Debian或Ubuntu中,您可以使用apt安装它们
# apt-get install libpoppler-glib-dev python-gtk2 python-cairo-dev python-gobject-dev python-gobject
确保您有实际的gcc版本,因为pycairo将需要它(它将添加选项-fstack-protector-strong到编译选项)。这个库很难安装,所以这里是我使用的命令行
$ pip install pycairo==1.8.8 –allow-unverified pycairo –allow-external pycairo
然后您可以像平常一样安装它
$ pip install pdfcomparator
用法
格式如下
$ pdfcompare.py pattern current
它将比较“pattern”和“current”下的文件。
如果它们相等,将不打印任何内容。如果它们不同,将打印不同的第一页,并且脚本将返回2。
相似度
通常,两页是相等或不等的。但也许您只需要一个相似度百分比。因此,您可以使用百分比。通常,这会使比较变慢。
因此,它将使用不同的算法来检查更高的相似度比率。如果任何一个失败,整个比较都会失败。
您可以通过使用选项–precise启用精确算法,并使用–ratio=0.8设置相似度比率,使用介于0和1之间的任何数字。
享受它!
贡献
如果您想贡献,请创建一个VirtualEnv环境
$ virtualenv venv --system-site-packages $ . venv/bin/activate
使用系统包是为了找到python-gobject库,这是很重要的。
现在,您应该能够安装pdfcomparator包
$ python setup.py develop
并且测试它
$ python setup.py test
项目详情
关闭
pdfcomparator-0.3.0.tar.gz的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 9a41e675475de8ff26d39fdc752830dc358f171f590130fbe89cbb30270c37af |
|
MD5 | f557ba1110ea2ff11a911bcdd9ebe63a |
|
BLAKE2b-256 | c5634a08aa9ffb2363945bae30204d2dbf8fb6a5ef71acb9ddc5dcf832f7f3ad |
关闭
pdfcomparator-0.3.0-py2-none-any.whl的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 51c93d949558cad3cb77ecf0341256c50fe3fe0ba03cd5ebaa60eeeab83dafdd |
|
MD5 | 1840a9292e3265bcb40fc69efd370139 |
|
BLAKE2b-256 | dfbbf3bf9c25dd9227a5e2fd78cebd58f0509c4820b3795b264a61ed59ddf76b |