extract-html-diff · PyPI · Python 包索引

提取两个HTML页面之间的差异

这些详情尚未由PyPI验证

项目链接

主页

项目描述

此包允许您提取两个HTML页面之间的差异：给定页面A和B，它将尝试提取A中在B中更改的部分。它使用底层的lxml.html.diff，但仅提供更改部分作为HTML。

目前需要Python 3。

许可证是MIT。

安装

您可以从PyPI安装此包

pip install extract-html-diff

用法

您可以将差异作为文本提取

import extract_html_diff

html = '<div> <h1>My site</h1> <div>My content</div> </div>'
other_html = '<div> <h1>My site</h1> <div>Other content</div> </div>'

extract_html_diff.as_string(html, other_html)

这将给您

'<div><div>My content</div>  </div>'

如果您计划进行额外的转换或更改序列化，您也可以获取作为树（一个lxml.html.HtmlElement）的差异

extract_html_diff.as_tree(html, other_html)

您可以传递输入HTML作为str或bytes（在这种情况下，它将使用lxml.html.fromstring解析），或作为已解析的lxml.html.HtmlElement。

项目详情

这些详情尚未由PyPI验证

项目链接

主页

发布历史发布通知 | RSS源

此版本

0.1.0

2017年2月20日

下载文件

下载适用于您的平台的文件。如果您不确定选择哪个，请了解有关安装包的更多信息。

源分布

extract-html-diff-0.1.0.tar.gz (4.5 kB 查看哈希值)

上传时间 2017年2月20日 源代码

extract-html-diff-0.1.0.tar.gz 的哈希值

extract-html-diff-0.1.0.tar.gz 的哈希值
算法	哈希摘要
SHA256	`03f4e40b6d40689e7faf0188422e41bb6915f4be0e3c1cc3f0e0e0bcb9be15f1`
MD5	`0109b54a677a9d2c710f89002931bc91`
BLAKE2b-256	`d1665d06e4425b484f4f25be50a0d5fa95689214bc3c6802d2fd403784d56220`

extract-html-diff 0.1.0

导航

验证详情

维护者

未验证详情

项目链接

元信息

分类器

项目描述

安装

用法

项目详情

验证详情

维护者

未验证详情

项目链接

元信息

分类器

发布历史发布通知 | RSS源

下载文件

源分布

extract-html-diff 0.1.0

导航

验证详情

维护者

未验证详情

项目链接

元信息

分类器

项目描述

安装

用法

项目详情

验证详情

维护者

未验证详情

项目链接

元信息

分类器

发布历史 发布通知 | RSS源

下载文件

源分布

发布历史发布通知 | RSS源