跳转到主要内容

未提供项目描述

项目描述

header.png

这是一个下载不同类别免费O'Reilly电子书的工具,请参阅http://shop.oreilly.com/category/ebooks.do

这个工具不是故意使用scrapy(部分是为了避免配置 fest),并且是分两个阶段实现的

  1. 爬取O'Reilly在线商店以编译PDF文件的URL列表,以及

  2. 下载第1步中创建的列表中的所有文件。

第1步是顺序执行的(目前如此),而对于第2步,您可以使用“requests”和“aiohttp”分别选择顺序版和并行版。

请参阅“docs/sessions”文件夹中的session1.txtsession2.txtsession3.txt,以了解不同大小的一些用例。

安装

您可以从Python包索引使用简单的pip install freebora安装freebora,或者从GitHub克隆或下载此代码,并在其根目录中运行python3 setup.py install。目前它只打算在Python 3上运行。

测试

您可以通过以下方式运行(相当小)的测试套件

# using py.test (needs a pip install pytest):
py.test -v tests

# using a minified version of py.test, included in runtests.py:
python3 setup.py test

可以像这样运行单个测试

py.test -s tests/test_oreilly_shop.py

待办事项

  • 添加收集URL的函数的异步版本(上面的第1步)

  • 改进命令行界面

  • 添加功能以下载不仅仅是PDF,还有其他格式

  • 添加功能以交互式选择要下载的单个电子书

项目详情


下载文件

下载适用于您的平台文件。如果您不确定选择哪个,请了解更多关于安装包的信息。

源分布

freebora-0.1.0.tar.gz (203.8 kB 查看哈希值)

上传时间 源码

构建版本

freebora-0.1.0-py3-none-any.whl (6.3 kB 查看哈希值)

上传时间 Python 3

由以下支持