用于网页抓取项目的工具集
项目描述
Weblib
Weblib提供了解决网页抓取中典型任务的工具
处理HTML
处理文本编码
控制重复和并行任务
解析RSS/ATOM源
准备HTTP请求的数据
操作DOM树
操作文本和数值数据
常用用户代理列表
跨平台文件锁定
文件和目录操作
安装
运行
pip install -U weblib
文档
文档不完整。大部分文档是从模块/方法docstrings自动生成的。请在此处查看文档http://weblib.readthedocs.org/en/latest/
项目详情
关闭
weblib-0.1.30.tar.gz 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | e26cbc66e8c7d6ca81daefbce253bab5c5b8a001fc85c1913f682b27ced3791c |
|
MD5 | a29d3709cb4d5264d8e87ada0164148b |
|
BLAKE2b-256 | 67162761dab6e8515708a2762dc34e6b8e089df21211d98f91d298911f2fd5b0 |