跳转到主要内容

用于网页抓取项目的工具集

项目描述

Weblib

https://travis-ci.org/lorien/weblib.png?branch=master https://coveralls.io/repos/lorien/weblib/badge.svg?branch=master https://readthedocs.org/projects/weblib/badge/?version=latest

Weblib提供了解决网页抓取中典型任务的工具

  • 处理HTML

  • 处理文本编码

  • 控制重复和并行任务

  • 解析RSS/ATOM源

  • 准备HTTP请求的数据

  • 操作DOM树

  • 操作文本和数值数据

  • 常用用户代理列表

  • 跨平台文件锁定

  • 文件和目录操作

安装

运行

pip install -U weblib

文档

文档不完整。大部分文档是从模块/方法docstrings自动生成的。请在此处查看文档http://weblib.readthedocs.org/en/latest/

项目详情


下载文件

下载您平台的文件。如果您不确定选择哪个,请了解有关安装包的更多信息。

源分布

weblib-0.1.30.tar.gz (30.4 kB 查看哈希值)

上传时间

由以下支持