跳转到主要内容

Zyte的网页抓取页面对象模式

项目描述

PyPI Version Supported Python Versions Tox Ubuntu Tox Windows Coverage report Documentation Status

web-poet是Python 3.8+的页面对象模式实现,用于网页抓取。它使编写可移植、可重用的网页解析代码成为可能。

查看文档

开发

通过以下方式设置您的本地Python环境:

  1. pip install -r requirements-dev.txt

  2. pre-commit install

现在,每次您执行一个 git commit,这些工具都会针对暂存文件运行

  • black

  • isort

  • flake8

您也可以直接调用 pre-commit run –all-filestox -e linters 来运行它们,而无需执行提交。

项目详情


下载文件

下载适用于您平台的文件。如果您不确定选择哪个,请了解有关安装包的更多信息。

源分发

web-poet-0.17.0.tar.gz (68.6 kB 查看哈希值)

上传时间:

构建分发

web_poet-0.17.0-py3-none-any.whl (46.8 kB 查看哈希值)

上传时间: Python 3

由以下支持

AWS AWS 云计算和安全赞助商 Datadog Datadog 监控 Fastly Fastly CDN Google Google 下载分析 Microsoft Microsoft PSF 赞助商 Pingdom Pingdom 监控 Sentry Sentry 错误日志 StatusPage StatusPage 状态页面