网络抓取库

这些详情未由PyPI验证

项目链接

项目描述

Beautiful Soup是一个库，它使从网页中抓取信息变得简单。它位于HTML或XML解析器之上，为迭代、搜索和修改解析树提供Pythonic惯用语法。

快速开始

>>> from bs4 import BeautifulSoup
>>> soup = BeautifulSoup("<p>Some<b>bad<i>HTML")
>>> print(soup.prettify())
<html>
 <body>
  <p>
   Some
   <b>
    bad
    <i>
     HTML
    </i>
   </b>
  </p>
 </body>
</html>
>>> soup.find(text="bad")
'bad'
>>> soup.i
<i>HTML</i>
#
>>> soup = BeautifulSoup("<tag1>Some<tag2/>bad<tag3>XML", "xml")
#
>>> print(soup.prettify())
<?xml version="1.0" encoding="utf-8"?>
<tag1>
 Some
 <tag2/>
 bad
 <tag3>
  XML
 </tag3>
</tag1>

要超越基础，请参阅全面文档。

链接

关于Python 2的弃用说明

Beautiful Soup对Python 2的支持已于2020年12月31日停止：在Python 2本身停用日期后一年。从现在开始，新的Beautiful Soup开发将仅针对Python 3。支持Python 2的Beautiful Soup 4的最终版本是4.9.3。

支持项目

如果您将Beautiful Soup作为您专业工作的一部分，请考虑Tidelift订阅。这将支持您组织依赖的许多免费软件项目，而不仅仅是Beautiful Soup。

如果您将Beautiful Soup用于个人项目，最好的感谢方式是阅读我写的关于Beautiful Soup在软件开发中教会我的《工具安全》（Tool Safety）小册子。

构建文档

bs4/doc/目录包含Sphinx格式的完整文档。在该目录中运行make html以创建HTML文档。

运行单元测试

Beautiful Soup支持使用Pytest进行单元测试发现。

$ pytest

项目详情

这些详情未由PyPI验证

项目链接

发布历史发布通知 | RSS源

4.13.0b2 预发布

2024年3月20日

本版本

4.12.3

2024年1月17日

4.12.2

2023年4月7日

4.12.1

2023年4月5日

4.12.0

2023年3月20日

4.11.2

2023年1月31日

4.11.1

2022年4月8日

4.11.0

2022年4月7日

4.10.0

2021年9月8日

4.9.3

2020年10月3日

4.9.2

2020年9月26日

4.9.1

2020年5月17日

4.9.0

2020年4月5日

4.8.2

2019年12月24日

4.8.1

2019年10月6日

4.8.0

2019年7月20日

4.7.1

2019年1月7日

4.7.0

2018年12月31日

4.6.3

2018年8月12日

4.6.2

2018年8月12日

4.6.1

2018年7月28日

4.6.0

2017年5月7日

4.5.3

2017年1月2日

4.5.2

2017年1月2日

4.5.1

2016年8月3日

4.5.0

2016年7月20日

4.4.1

2015年9月29日

4.4.0

2015年7月3日

4.3.2

2013年10月2日

4.3.1

2014年1月21日

4.3.0

2014年1月21日

4.2.1

2014年1月21日

4.2.0

2014年1月21日

4.1.3

2014年1月21日

4.1.2

2014年1月21日

4.1.1

2014年1月21日

4.1.0

2014年1月21日

4.0.5

2014年1月21日

4.0.4

2014年1月21日

4.0.3

2014年1月21日

4.0.2

2014年1月21日

4.0.1

2014年1月21日

下载文件

下载适合您平台的文件。如果您不确定选择哪个，请了解更多关于安装包的信息。

源代码分布

beautifulsoup4-4.12.3.tar.gz (581.2 kB 查看哈希值)

上传日期 2024年1月17日 源代码

构建分布

beautifulsoup4-4.12.3-py3-none-any.whl (147.9 kB 查看哈希值)

上传日期 2024年1月17日 Python 3

哈希值 for beautifulsoup4-4.12.3.tar.gz

哈希值 for beautifulsoup4-4.12.3.tar.gz
算法	哈希摘要
SHA256	`74e3d1928edc070d21748185c46e3fb33490f22f52a3addee9aee0f4f7781051`
MD5	`4ecf1fb561e84adfb3146650e3d51394`
BLAKE2b-256	`b3ca824b1195773ce6166d388573fc106ce56d4a805bd7427b624e063596ec58`

哈希值 for beautifulsoup4-4.12.3-py3-none-any.whl

哈希值 for beautifulsoup4-4.12.3-py3-none-any.whl
算法	哈希摘要
SHA256	`b80878c9f40111313e55da8ba20bdba06d8fa3969fc68304167741bbf9e082ed`
MD5	`47df28fd656b4a8df368d9a915794454`
BLAKE2b-256	`b1fee8c672695b37eecc5cbf43e1d0638d88d66ba3a44c4d321c796f4e59167f`

beautifulsoup4 4.12.3

导航

验证详情

维护者

未验证详情

项目链接

元信息

分类器

项目描述

快速开始

链接

关于Python 2的弃用说明

支持项目

构建文档

运行单元测试

项目详情

验证详情

维护者

未验证详情

项目链接

元信息

分类器

发布历史发布通知 | RSS源

下载文件

源代码分布

构建分布

beautifulsoup4 4.12.3

导航

验证详情

维护者

未验证详情

项目链接

元信息

分类器

项目描述

快速开始

链接

关于Python 2的弃用说明

支持项目

构建文档

运行单元测试

项目详情

验证详情

维护者

未验证详情

项目链接

元信息

分类器

发布历史 发布通知 | RSS源

下载文件

源代码分布

构建分布

发布历史发布通知 | RSS源