memorious · PyPI · Python 包索引

Python的一个简约、递归网络爬虫库。

这些详情尚未由PyPI验证

项目链接

首页

项目描述

一个多形态、瞬息万变且几乎无法忍受的精确世界的孤独而清晰的观众。

—— 记忆中的菲内斯，豪尔赫·路易斯·博尔赫斯

https://github.com/alephdata/memorious/workflows/memorious/badge.svg

memorious 是一个轻量级的网络爬虫工具包。它支持收集结构化或非结构化数据的爬虫。这包括以下用例

使爬虫模块化并使简单任务可重复使用
提供执行常见任务（如数据存储、HTTP会话管理）的实用函数
将爬虫与 Aleph 和 FollowTheMoney 生态系统集成
尽可能少地打扰你

设计

编写爬虫时，通常需要通过索引页进行分页，然后下载每个结果的HTML页面，最后解析该页面并在数据库中插入或更新一条记录。

memorious 通过管理一组爬虫来处理这个问题，每个爬虫可以由多个阶段组成。每个阶段都使用 Python 函数实现，可以在不同的爬虫中重复使用。

编写 Memorious 爬虫的基本步骤

创建 YAML 爬虫配置文件
添加不同的阶段
编写阶段操作代码（可选）
测试、清洗、重复

文档

Memorious 的文档可在 alephdata.github.io/memorious 查找。请随意编辑 docs 文件夹中的源文件，并通过发送改进的拉取请求。

要在 docs 文件夹中构建文档，请运行 make html

您将在 /docs/_build/html 中找到生成的 HTML 文件。

项目详情

这些详情尚未由PyPI验证

项目链接

首页

发布历史发布通知 | RSS 源

本版本

2.6.5

2024年1月10日

2.6.4

2023年8月29日

2.6.3

2023年7月12日

2.6.2

2023年5月4日

2.5.0

2022年2月28日

2.4.5

2021年10月27日

2.4.4

2021年10月22日

2.4.3

2021年10月21日

2.4.2

2021年9月22日

2.4.1

2021年9月2日

2.4.0

2021年9月2日

2.3.4

2021年7月2日

2.3.3

2021年7月1日

2.3.2

2021年7月1日

2.3.1

2021年7月1日

2.3.0

2021年6月22日

2.2.0

2021年5月4日

2.1.1

2021年4月8日

2.1.0

2021年4月8日

2.0.0

2021年3月30日

1.9.0

2021年1月20日

1.8.4

2020年12月8日

1.8.3

2020年10月27日

1.8.2

2020年9月27日

1.8.0

2020年7月10日

1.7.4

2020年7月1日

1.7.3

2020年7月1日

1.7.2

2020年6月30日

1.7.1

2020年6月30日

1.7.0

2020年6月24日

1.6.2

2020年6月10日

1.6.1

2020年5月28日

1.6.0

2020年5月4日

1.5.6

2020年4月23日

1.5.5

2020年4月6日

1.5.4

2020年3月8日

1.5.3

2020年3月8日

1.5.2

2020年1月30日

1.5.1

2020年1月30日

1.5.0

2020年1月29日

1.4.3

2020年1月27日

1.4.2

2020年1月19日

1.4.1

2019年12月6日

1.4.0

2019年12月4日

1.3.0

2019年12月3日

1.2.10

2019年12月3日

1.2.9

2019年10月22日

1.2.8

2019年10月22日

1.2.5

2019年10月21日

1.2.4

2019年10月21日

1.2.3

2019年10月3日

1.2.1

2019年9月21日

1.2.0

2019年9月19日

1.1.3

2019年9月3日

1.1.2

2019年8月2日

1.1.1

2019年8月1日

1.1.0

2019年8月1日

1.0.0

2019年7月30日

0.14.2

2019年7月12日

0.14.1

2019年7月12日

0.14.0

2019年7月12日

0.13.0

2019年7月10日

0.12.0

2019年5月2日

0.11.1

2019年4月5日

0.11.0

2019年3月17日

0.10.1

2019年3月5日

0.10.0

2019年1月31日

0.9.2

2019年1月9日

0.9.1

2019年1月9日

0.9.0

2019年1月9日

0.8.0

2018年12月28日

0.7.20

2018年12月14日

0.7.19

2018年10月10日

0.7.18

2018年9月2日

0.7.17

2018年8月27日

0.7.16

2018年8月27日

0.7.15

2018年8月27日

0.7.14

2018年8月23日

0.7.13

2018年8月19日

0.7.12

2018年8月19日

0.7.11

2018年8月19日

0.7.10

2018年8月18日

0.7.9

2018年8月15日

0.7.8

2018年8月10日

0.7.7

2018年8月10日

0.7.6

2018年8月1日

0.7.4

2018年7月18日

0.7.3

2018年7月17日

0.7.2

2018年7月17日

0.7.1

2018年7月14日

0.7.0

2018年7月14日

0.6.1

2018年7月9日

0.6.0

2018年7月9日

0.5.5

2018年5月21日

0.5.4

2018年5月16日

0.5.3

2018年5月15日

0.5.2

2018年5月4日

0.5.1

2018年5月4日

0.5.0

2018年5月1日

0.4.12

2018年4月13日

0.4.11

2018年4月12日

0.4.10

2018年4月12日

0.4.9

2018年4月11日

0.4.8

2018年4月11日

0.4.7

2018年4月11日

0.4.6

2018年3月28日

0.4.5

2018年3月28日

0.4.4

2018年3月14日

下载文件

下载适合您平台的文件。如果您不确定选择哪个，请了解更多关于安装包的信息。

源分发

memorious-2.6.5.tar.gz (41.0 kB 查看哈希值)

上传时间 2024年1月10日 源

构建分发

memorious-2.6.5-py2.py3-none-any.whl (52.4 kB 查看哈希值)

上传于 2024年1月10日 Python 2 Python 3

散列值 for memorious-2.6.5.tar.gz

memorious-2.6.5.tar.gz 的散列值
算法	散列摘要
SHA256	`5690d32309cc7a269190bd157df7b6a4c9f9f9e896367ea1ba02d483c211e76d`
MD5	`69beecfbb546ca35eff82b47771f8ef6`
BLAKE2b-256	`508597ec7c1f8bdd90f73347b3972a5b6c663f5995e7a49e4cd3f73c46af8510`

散列值 for memorious-2.6.5-py2.py3-none-any.whl

memorious-2.6.5-py2.py3-none-any.whl 的散列值
算法	散列摘要
SHA256	`5997259e0e5e3e92012bd87d506dfd947f8900c53e8c5717696169a523c48780`
MD5	`3c64862426bff79ca7744238b1057dcd`
BLAKE2b-256	`70dcf8543dbc42b92a041bfa59a5aa57e61e9a8906cd8bde1bcbe6fcca51dbe1`

memorious 2.6.5

导航

验证详情

维护者

未验证详情

项目链接

元数据

分类器

项目描述

设计

文档

项目详情

验证详情

维护者

未验证详情

项目链接

元数据

分类器

发布历史发布通知 | RSS 源

下载文件

源分发

构建分发

memorious 2.6.5

导航

验证详情

维护者

未验证详情

项目链接

元数据

分类器

项目描述

设计

文档

项目详情

验证详情

维护者

未验证详情

项目链接

元数据

分类器

发布历史 发布通知 | RSS 源

下载文件

源分发

构建分发

发布历史发布通知 | RSS 源