Scrapy蜘蛛中间件,用于在多值键上将一个项目分割成多个项目
项目描述
SplitVariantsMiddleware 是一个Scrapy蜘蛛中间件,用于在项目具有多个值的“变体”键时将其分割成多个项目。
用法示例
假设您的蜘蛛输出一个具有不同尺寸选项的项目(例如来自电子商务网站)
item = {"id": 12, "name": "Big chair", "variants": [{"size": "XL", "price": 200, "currency": "USD"}, {"size": "L", "price": 100, "currency": "USD"}]}
当您启用 SplitVariantsMiddleware 时,此单个项目将变成具有不同变体值的不同项目。
{"id": 12, "name": "Big chair", "size": "XL", "price": 200, "currency": "USD"} {"id": 12, "name": "Big chair", "size": "L", "price": 100, "currency": "USD"}
安装
使用 pip 安装 scrapy-splitvariants
$ pip install scrapy-splitvariants
配置
通过在您的 settings.py 文件中包含 SplitVariantsMiddleware 来添加它到 SPIDER_MIDDLEWARES
SPIDER_MIDDLEWARES = { 'scrapy_splitvariants.SplitVariantsMiddleware': 100, }
这里,优先级 100 只是一个示例。根据您已启用的其他中间件设置其值。
通过在您的 setting.py 中将 SPLITVARIANTS_ENABLED 设置为 True 来启用中间件。
项目详情
下载文件
下载适合您平台的文件。如果您不确定选择哪个,请了解更多关于 安装包 的信息。
源分布
scrapy-splitvariants-1.1.0.tar.gz (2.1 kB 查看散列)
构建分布
关闭
散列 对于 scrapy_splitvariants-1.1.0-py2.py3-none-any.whl
算法 | 散列摘要 | |
---|---|---|
SHA256 | da425cdaa03101406f076bd9600429d997ed395288e47bd4032e0a0b23d9f478 |
|
MD5 | f0ea6737148ae0e8b3834d648f6c96fe |
|
BLAKE2b-256 | 33fdb5a0d2d0c8a4ba9636c09f6d47cc5d1ef56561a076c5f9aae89b6e5b68f2 |