高级Web爬取和Web抓取框架
项目描述
Scrapy
概览
Scrapy 是一个BSD授权的快速高级网络爬虫和网页抓取框架,用于爬取网站并从其页面中提取结构化数据。它可以用于各种目的,从数据挖掘到监控和自动化测试。
Scrapy 由 Zyte(原名 Scrapinghub)和其他许多贡献者维护。
请访问 https://scrapy.net.cn 的 Scrapy 主页以获取更多信息,包括功能列表。
要求
Python 3.8+
支持 Linux、Windows、macOS、BSD
安装
快速方式
pip install scrapy
有关更多详细信息,请参阅文档中的安装部分 https://docs.scrapy.net.cn/en/latest/intro/install.html。
文档
文档可在网上 https://docs.scrapy.net.cn/ 和 docs 目录中找到。
版本发布
您可以在 https://docs.scrapy.net.cn/en/latest/news.html 检查版本发布说明。
社区(博客、Twitter、邮件列表、IRC)
有关详细信息,请参阅 https://scrapy.net.cn/community/。
贡献
有关详细信息,请参阅 https://docs.scrapy.net.cn/en/master/contributing.html。
行为准则
请注意,本项目附带贡献者 行为准则。
通过参与本项目,您同意遵守其条款。如有不适当行为,请向 opensource@zyte.com 报告。
使用 Scrapy 的公司
有关公司列表,请参阅 https://scrapy.net.cn/companies/。
商业支持
有关详细信息,请参阅 https://scrapy.net.cn/support/。
项目详情
下载文件
下载适合您平台的文件。如果您不确定选择哪个,请了解有关安装包的更多信息。
源分发
scrapy-2.11.2.tar.gz (1.2 MB 查看哈希值)
构建分发
Scrapy-2.11.2-py2.py3-none-any.whl (290.1 kB 查看哈希值)