针对HTML和XML文档的结构化diff
项目描述
XML和HTML文档的结构化diff。
预期用途是简洁地显示文档中的编辑内容,以便HTML内容作者可以审查他们的工作。
我们所说的“HTML树diff”是什么意思?
HTML:diff函数的输入是HTML文档
树:它考虑了输入的完整XML树结构,而不仅仅是基于文本的变化。
Diff:输出是可读的HTML,使用<ins>和<del>标签来显示变化。
命令行界面
您可以直接作为Python模块执行htmltreediff.cli,并将HTML文件传递给它进行diff
$ python -m htmltreediff.cli one.html two.html <h1> <del> one </del> <ins> two </ins> </h1>
Python API
您还可以在Python程序中将htmltreediff作为库使用。
对于HTML更改
>>> from htmltreediff import diff >>> print diff('<h1>...one...</h1>', '<h1>...two...</h1>', pretty=True) <h1> ... <del> one </del> <ins> two </ins> ... </h1>
同时也适用于纯文本更改
>>> print diff( ... 'The quick brown fox jumps over the lazy dog.', ... 'The very quick brown foxes jump over the dog.', ... html=False, ... ) The <ins>very </ins>quick brown <del>fox jumps</del><ins>foxes jump</ins> over the<del> lazy</del> dog.
运行单元测试
单元测试套件需要运行 nose 和 coverage 包。只需运行 run_tests.sh 脚本,所有测试都会运行,并显示代码覆盖率。代码覆盖率应始终为100%。
项目详情
关闭
html-tree-diff-0.1.2.tar.gz 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | eb7f7be7c2bef85de648738b04984ccd674597acbb6bdb1a227858ab9b442fb9 |
|
MD5 | 6bc02e9b3dac3fb443b3b5691b74c0f5 |
|
BLAKE2b-256 | 16ea355c959c63c2bed029265f7c9b67a5361a786b22cf7aacd32ee79c5c7d6b |