html-stripper · PyPI · Python 包索引

一个简单的包，用于从（即使是损坏的/无效的）HTML中提取文本

这些详情尚未通过PyPI验证

项目链接

首页

项目描述

一个简单的包，用于从（即使是损坏的/无效的）HTML中提取文本。无依赖项，它仅使用Python的内部HTMLParser进行一些调整。

用法

from html_stripper import strip_tags
text = strip_tags("<html>…")

from html_stripper import strip_tags
import requests
strip_tags(requests.get("https://foo.bar/").text)

from html_stripper import strip_tags, strip_multiple_newlines
text = strip_multiple_newlines(strip_tags("<html>…")) # replaces chained newlines with a single \n

项目详情

这些详情尚未通过PyPI验证

项目链接

首页

发布历史发布通知 | RSS源

此版本

0.3

2020年7月30日

0.2.1

2020年7月30日

0.2

2020年7月30日

0.1

2020年7月30日

下载文件

为您的平台下载文件。如果您不确定选择哪个，请了解更多关于安装包的信息。

源分布

html_stripper-0.3.tar.gz (15.2 kB 查看哈希值)

上传时间： 2020年7月30日 源

html_stripper-0.3.tar.gz的哈希值

html_stripper-0.3.tar.gz的哈希值
算法	哈希摘要
SHA256	`b9ea66bc75d00adc06447f3c3a278899c10cf12fad0c0faab39457057b4056b9`
MD5	`50dfb87e9e4fe54b52f35dfff89cca5e`
BLAKE2b-256	`21e0c6b141679eed08bb139a7a82f36ed30336b15d69c9b2c4a735549a53efad`