itemloaders · PyPI · Python 包索引

Scrapy的ItemLoader的基本库

这些详细信息尚未由PyPI 验证

项目链接

项目描述

itemloaders 是一个库，帮助您从HTML和XML源收集数据。

它非常适合从网页中提取数据，因为它支持使用CSS和XPath选择器进行数据提取。

当您需要标准化来自许多源的数据时特别有用。例如，它允许您将所有铸造和解析规则放在一个地方。

以下是一个示例以帮助您开始

from itemloaders import ItemLoader
from parsel import Selector

html_data = '''
<!DOCTYPE html>
<html>
    <head>
        <title>Some random product page</title>
    </head>
    <body>
        <div class="product_name">Some random product page</div>
        <p id="price">$ 100.12</p>
    </body>
</html>
'''
loader = ItemLoader(selector=Selector(html_data))
loader.add_xpath('name', '//div[@class="product_name"]/text()')
loader.add_xpath('name', '//div[@class="product_title"]/text()')
loader.add_css('price', '#price::text')
loader.add_value('last_updated', 'today') # you can also use literal values
item = loader.load_item()
item
# {'name': ['Some random product page'], 'price': ['$ 100.12'], 'last_updated': ['today']}

有关更多信息，请参阅文档。

贡献

所有贡献都受欢迎！

如果您想审查一些代码，请检查这里的开放 Pull Requests
如果您想提交代码更改
- 如果还没有，请在此处提交问题
- Fork此存储库
- 创建一个分支以对更改进行工作
- 运行 pre-commit install 以安装预提交钩子
- 推送您的本地分支并提交Pull Request

项目详情

这些详细信息尚未由PyPI 验证

项目链接

发布历史发布通知 | RSS订阅

此版本

1.3.2

2024年9月30日

1.3.1

2024年6月3日

1.3.0

2024年5月30日

1.2.0

2024年4月18日

1.1.0

2023年4月21日

1.0.6

2022年8月29日

1.0.5

2022年8月25日

1.0.4

2020年11月12日

1.0.3

2020年9月9日

1.0.2

2020年8月5日

1.0.1

2020年7月2日

1.0.0

2020年5月18日

0.1

2020年5月4日

下载文件

下载适合您平台的文件。如果您不确定选择哪一个，请了解更多关于安装包的信息。

源代码分发

itemloaders-1.3.2.tar.gz (19.7 kB 查看哈希值)

上传时间 2024年9月30日 源代码

构建分发

itemloaders-1.3.2-py3-none-any.whl (12.2 kB 查看哈希值)

上传时间 2024年9月30日 Python 3

哈希值 for itemloaders-1.3.2.tar.gz

itemloaders-1.3.2.tar.gz的哈希值
算法	哈希摘要
SHA256	`4faf5b3abe83bf014476e3fd9ccf66867282971d9f1d4e96d9a61b60c3786770`
MD5	`07e11fabfc7d85ff84d6e22abcb26eb5`
BLAKE2b-256	`b63ec549370e95c9dc7ec5e155c075e2700fa75abe5625608a4ce5009eabe0bf`

哈希值 for itemloaders-1.3.2-py3-none-any.whl

itemloaders-1.3.2-py3-none-any.whl的哈希值
算法	哈希摘要
SHA256	`6a91465f721c7bad8b07e1fbb0560cf99f4845156ed9f7bf2ca424336c6a677c`
MD5	`346c3cb185c154eea704febe3c1dd648`
BLAKE2b-256	`d5689592dcfd9c24467b545fac17b098a171e372bf0d775400fa1971712bca57`

itemloaders 1.3.2

导航

已验证详细信息

维护者

未验证详细信息

项目链接

元数据

分类

项目描述

贡献

项目详情

已验证详细信息

维护者

未验证详细信息

项目链接

元数据

分类

发布历史发布通知 | RSS订阅

下载文件

源代码分发

构建分发

itemloaders 1.3.2

导航

已验证详细信息

维护者

未验证详细信息

项目链接

元数据

分类

项目描述

贡献

项目详情

已验证详细信息

维护者

未验证详细信息

项目链接

元数据

分类

发布历史 发布通知 | RSS订阅

下载文件

源代码分发

构建分发

发布历史发布通知 | RSS订阅