跳转到主要内容

使用lxml的Parsley提取库

项目描述

Parslepy允许您从HTML和XML文档中提取内容,其中提取规则使用JSON对象或等效Python字典定义,其中键是要分配给提取内容的名称,值是CSS选择器或XPath表达式。

Parslepy是实现Parsley提取语言此处的版本,使用lxml和cssselect。

您可以嵌套对象,生成对象列表,并且在一定程度上可以混合CSS和XPath。

Parslepy理解lxml和cssselect理解的内容,这大致是CSS3选择器和XPath 1.0表达式。

文档与示例

请参阅https://github.com/redapple/parslepy/wiki#usage

项目详情


下载文件

下载适用于您的平台的文件。如果您不确定选择哪个,请了解有关安装包的更多信息。

源分布

parslepy-0.3.0.tar.gz (13.2 kB 查看哈希)

上传时间:

由以下支持

AWS AWS 云计算和安全赞助商 Datadog Datadog 监控 Fastly Fastly CDN Google Google 下载分析 Microsoft Microsoft PSF赞助商 Pingdom Pingdom 监控 Sentry Sentry 错误日志 StatusPage StatusPage 状态页面