跳转到主要内容

针对HTML和XML文档的结构化diff

项目描述

XML和HTML文档的结构化diff。

预期用途是简洁地显示文档中的编辑内容,以便HTML内容作者可以审查他们的工作。

我们所说的“HTML树diff”是什么意思?

  • HTML:diff函数的输入是HTML文档

  • 树:它考虑了输入的完整XML树结构,而不仅仅是基于文本的变化。

  • Diff:输出是可读的HTML,使用<ins>和<del>标签来显示变化。

命令行界面

您可以直接作为Python模块执行htmltreediff.cli,并将HTML文件传递给它进行diff

$ python -m htmltreediff.cli one.html two.html
<h1>
  <del>
    one
  </del>
  <ins>
    two
  </ins>
</h1>

Python API

您还可以在Python程序中将htmltreediff作为库使用。

对于HTML更改

>>> from htmltreediff import diff
>>> print diff('<h1>...one...</h1>', '<h1>...two...</h1>', pretty=True)
<h1>
  ...
  <del>
    one
  </del>
  <ins>
    two
  </ins>
  ...
</h1>

同时也适用于纯文本更改

>>> print diff(
...     'The quick brown fox jumps over the lazy dog.',
...     'The very quick brown foxes jump over the dog.',
...     html=False,
... )
The <ins>very </ins>quick brown <del>fox jumps</del><ins>foxes jump</ins> over the<del> lazy</del> dog.

运行单元测试

单元测试套件需要运行 nosecoverage 包。只需运行 run_tests.sh 脚本,所有测试都会运行,并显示代码覆盖率。代码覆盖率应始终为100%。

项目详情


下载文件

下载适用于您平台的文件。如果您不确定选择哪个,请了解更多关于 安装包 的信息。

源代码分发

html-tree-diff-0.1.2.tar.gz (22.8 kB 查看哈希值)

上传时间 源代码

由以下组织支持