跳转到主要内容

纯Python实现的robots.txt解析器替代品

项目描述

用支持现代robots.txt结构的RFC兼容实现替换内置的robotsparser,如Sitemaps、Allow和Crawl-delay。主要功能

  • 缓存获取的robots.txt

  • 从Expires头中获取过期时间

  • 批量查询

  • 可配置用于获取robots.txt的用户代理

  • 基于过期时间自动重新获取

这是一个修复过的分支,基于最后的纯Python版本,支持Python 2和3。

项目详情


下载文件

下载您平台的文件。如果您不确定选择哪个,请了解更多关于 安装软件包 的信息。

源代码分发

reppy2-0.3.6.tar.gz (72.7 kB 查看哈希值)

上传时间 源代码

构建分发

reppy2-0.3.6-py3-none-any.whl (12.2 kB 查看哈希值)

上传时间 Python 3

由...