Nasy Crawler Framework -- 从未有过如此纯粹的爬虫。
项目描述
目录
序言
从未有过如此纯粹的爬虫 nacf
。
尽管我经常编写爬虫,但我不喜欢使用像scrapy这样的大型框架,而是更喜欢简单的 requests+bs4
或更通用的 requests_html
。然而,这两个对于爬虫来说不方便。例如,错误重试或并行爬取等地方需要我自己编写。编写时不是很难,但编写过多可能会很繁琐。因此,我开始编写这个nacf(Nasy Crawler Framework),希望简化一些错误重试或并行编写爬虫的过程。
包
包 | 版本 | 描述 |
---|---|---|
requests-html | 0.10.0 | 为人类解析HTML。 |
nalude | 0.3.0 | 一个标准模块。受Haskell的Prelude启发。 |
用法
见测试。
开发过程
DONE Http函数
DONE Get
DONE Post
已完成Bug
已完成修复由inspect.Parameter引起的错误,导致函数并行下降。 :err:1
待办事项 文档
待办事项 使用说明
尾声
历史
版本 1.0.2
- 数据:
- 变更: 更新nalude。
版本 1.0.1
- 数据:
- 变更: 更新requests-html。
版本 1.0.0
- 数据:
- 变更: 现在,旧的HTTP方法(
get
和post
)无法接受多个URL。相反,我们可以使用gets
和posts
。 - 新增: -
nacf.html
nacf.json
nacf.gets
nacf.posts
- 包含: -
nalude
版本 0.1.2
- 数据:
- 修复: 修复了上一个版本中的inspect.Parameter错误。
版本 0.1.1
- 数据:
- 忽略: 由
inspect.Parameter
引起的错误。 - 需要帮助: 有人能帮我关于Parameter的问题吗?
版本 0.1.0
- 日期:
- 纪念版本: 第一个版本
- 基本功能。
项目详情
下载文件
下载适合您平台的文件。如果您不确定该选择哪个,请了解更多关于安装包的信息。
源代码分发
nacf-1.0.3.tar.gz (17.9 kB 查看哈希值)
构建分发
nacf-1.0.3-py3-none-any.whl (20.8 kB 查看哈希值)
关闭
nacf-1.0.3.tar.gz的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 845ca6adb3a8d977b4f3f2e14e7a83d6fce1178188bb8b10b50e0140692c0d47 |
|
MD5 | d833d1b96815be57d5299feb99ad1bda |
|
BLAKE2b-256 | b4479b65af0294d957bd0966fec0146e53397eb0df7059103ef4508dc1633f88 |
关闭
nacf-1.0.3-py3-none-any.whl的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | b6f54ecf39f80381885d9ea1b75d40bd85d0a347d95c1ae2cabbddbc0ba075c3 |
|
MD5 | a18820e408b1f2278169931fe78073f3 |
|
BLAKE2b-256 | 42e69e3131f0f66272f9e734471c8820e49c9313be250e12cb145040d8f360f6 |