pyDHTMLParser · PyPI · Python 包索引

Python HTML/XML 解析器，易于网页抓取。

这些详细信息尚未由PyPI验证

项目链接

主页

项目描述

https://badge.fury.io/py/pyDHTMLParser.png

https://img.shields.io/pypi/dm/pyDHTMLParser.svg

https://readthedocs.org/projects/pyDHTMLParser/badge/?version=latest

https://img.shields.io/github/issues/Bystroushaak/pyDHTMLParser.svg

https://img.shields.io/pypi/l/pyDHTMLParser.svg

这是什么？

DHTMLParser 是一个轻量级的 HTML/XML 解析器，专为从 DOM 中快速、轻松地选择选定标签而创建。

当您需要为某些网页编写自己的“游击队”API 或爬虫时，它非常有用。

如果您愿意，您还可以比通过连接字符串更容易地创建 HTML/XML 文档。

文档

完整的模块文档可以在以下位置找到： http://pyDHTMLParser.rtfd.org

更改日志

2.2.3

2020-04-12 修复 #25 (thx https://github.com/fm4d).

2.2.2

尝试修复奇怪的递归继承问题。

2.2.0

重新编写以与 python3 兼容。

2.1.0 - 2.1.8

状态解析器已修复 - 现在可以从类似于 <invalid tag=something"> 的无效 HTML 中恢复。

重新编写以使用 StateEnum 在解析器中，以提高可读性。

在 _raw_split() 期间禁用垃圾收集器。

修复 #16 - 在某些情况下导致无效输出的错误。

关闭 #17 - 实现忽略 < 作为小于符号的用法。

恢复了多行属性的兼容性。

.parseString() 现在不会尝试解析 HTML 元素参数。

实现了 first() 获取器。

许可协议更改为 MIT。

修复 #18：在某些情况下导致无效输出的错误。

添加 HTMLElement.__repr__().

添加 test_coverage.sh。

添加扩展的 test_equality() 覆盖率。

格式化改进。

改进了构造函数处理，现在可读性更强。

更新了 setup.py 的格式。

添加了更多测试。

修复了 #22 号问题；SpecialDict 中的 bug。

修复了一些令人头疼的 Unicode 问题。

修复了 docs/__init__.py 中的 python 2/3 问题。

getVersion() -> get_version().

2.0.10

添加了更多 removeTags() 的测试。

run_tests.sh 现在接受参数。

在 removeTags() 中检查字符串时，从 str 更改为 basestring。

2.0.6 - 2.0.9

修复了 toString() 和 tagToString() 的行为。

SpecialDict 现在从 OrderedDict 继承。

修改并添加了 .params 属性的测试（现在使用 OrderedDict）。

修复了 _repair_tags() 中的 bug。

移除了 _repair_tags() - 它实际上并不必要。

修复了一个可能造成无效 XML 输出的严重 bug。

2.0.1 - 2.0.5

修复了 .match() 中的 bug。

修复了文档中的断链问题。

修复了 .isAlmostEqual() 中的 bug。

.find()；修复了阻止 tag_name 为 None 的 bug。

为 SpecialDict 添加了 op .__eq__()。

为 HTMLElement 添加了新方法 .containsParamSubset()。

2.0.0

重写、重构、拆分为多个文件。

添加了几乎 100% 的代码的 unittest 覆盖率。

添加了更好的选择器方法（.wfind()，.match）。

添加了 Sphinx 文档。

修复了大量 bug。

项目详情

这些详细信息尚未由PyPI验证

项目链接

主页

发布历史发布通知 | RSS 源

本版本

2.2.3

2020 年 4 月 12 日

2.2.2

2017 年 2 月 18 日

2.2.1

2017 年 2 月 18 日

2.2.0

2017 年 2 月 5 日

2.1.8

2017 年 2 月 5 日

2.1.7

2016 年 3 月 22 日

2.1.6

2016 年 1 月 26 日

2.1.5

2015 年 11 月 14 日

2.1.4

2015 年 8 月 19 日

2.1.3

2015 年 7 月 9 日

2.1.2

2015 年 6 月 26 日

2.1.1

2015 年 5 月 31 日

2.1.0

2015 年 5 月 25 日

2.0.10

2015 年 4 月 19 日

2.0.9

2015 年 2 月 16 日

2.0.8

2014 年 11 月 1 日

2.0.7

2014 年 10 月 20 日

2.0.6

2014 年 9 月 29 日

2.0.5

2014 年 8 月 26 日

2.0.4

2014 年 8 月 26 日

2.0.3

2014 年 8 月 19 日

2.0.2

2014 年 8 月 7 日

2.0.1

2014 年 7 月 31 日

2.0.0

2014 年 7 月 31 日

1.7.6

2014 年 3 月 15 日

1.7.5

2014 年 2 月 14 日

1.7.4

2014 年 2 月 9 日

1.7.2

2014 年 2 月 9 日

下载文件

下载您平台的文件。如果您不确定选择哪个，请了解有关安装包的更多信息。

源分布

pyDHTMLParser-2.2.3.tar.gz (417.3 kB 查看散列)

上传时间 2020 年 4 月 12 日 源

构建分布

pyDHTMLParser-2.2.3-py3-none-any.whl (17.7 kB 查看散列)

上传时间 2020 年 4 月 12 日 Python 3

散列对于 pyDHTMLParser-2.2.3.tar.gz

pyDHTMLParser-2.2.3.tar.gz 的散列
算法	散列摘要
SHA256	`1fe4feabb5a2d8252f84208a99e35acbfc503e6392be45ead05d79aa73ae6d04`
MD5	`1cabb25835ecf56ac439a06b7121fed5`
BLAKE2b-256	`c3d1cfbc93e2e69fbe9efb927d93adc0d06319a1af3f5748698834b2c2f75616`

散列对于 pyDHTMLParser-2.2.3-py3-none-any.whl

pyDHTMLParser-2.2.3-py3-none-any.whl 的散列
算法	散列摘要
SHA256	`46c5dd6e82378d81ba6e666902eea95ae611a113eaea7c9f91a47c454778ba37`
MD5	`666f672f736ff019deb355b21fdbde67`
BLAKE2b-256	`5b9f9d91e41eb7810483f67ee675241f538c6fba9badd9ef064886ec3997d9fd`

pyDHTMLParser 2.2.3

导航

验证详细信息

维护者

未经验证详细信息

项目链接

元数据

分类

项目描述

这是什么？

文档

更改日志

2.2.3

2.2.2

2.2.0

2.1.0 - 2.1.8

2.0.10

2.0.6 - 2.0.9

2.0.1 - 2.0.5

2.0.0

项目详情

验证详细信息

维护者

未经验证详细信息

项目链接

元数据

分类

发布历史发布通知 | RSS 源

下载文件

源分布

构建分布

pyDHTMLParser 2.2.3

导航

验证详细信息

维护者

未经验证详细信息

项目链接

元数据

分类

项目描述

这是什么？

文档

更改日志

2.2.3

2.2.2

2.2.0

2.1.0 - 2.1.8

2.0.10

2.0.6 - 2.0.9

2.0.1 - 2.0.5

2.0.0

项目详情

验证详细信息

维护者

未经验证详细信息

项目链接

元数据

分类

发布历史 发布通知 | RSS 源

下载文件

源分布

构建分布

发布历史发布通知 | RSS 源