未提供项目描述
项目描述
这是一个下载不同类别免费O'Reilly电子书的工具,请参阅http://shop.oreilly.com/category/ebooks.do。
这个工具不是故意使用scrapy(部分是为了避免配置 fest),并且是分两个阶段实现的
爬取O'Reilly在线商店以编译PDF文件的URL列表,以及
下载第1步中创建的列表中的所有文件。
第1步是顺序执行的(目前如此),而对于第2步,您可以使用“requests”和“aiohttp”分别选择顺序版和并行版。
请参阅“docs/sessions”文件夹中的session1.txt、session2.txt和session3.txt,以了解不同大小的一些用例。
安装
您可以从Python包索引使用简单的pip install freebora安装freebora,或者从GitHub克隆或下载此代码,并在其根目录中运行python3 setup.py install。目前它只打算在Python 3上运行。
测试
您可以通过以下方式运行(相当小)的测试套件
# using py.test (needs a pip install pytest):
py.test -v tests
# using a minified version of py.test, included in runtests.py:
python3 setup.py test
可以像这样运行单个测试
py.test -s tests/test_oreilly_shop.py
待办事项
添加收集URL的函数的异步版本(上面的第1步)
改进命令行界面
添加功能以下载不仅仅是PDF,还有其他格式
添加功能以交互式选择要下载的单个电子书
项目详情
下载文件
下载适用于您的平台文件。如果您不确定选择哪个,请了解更多关于安装包的信息。
源分布
freebora-0.1.0.tar.gz (203.8 kB 查看哈希值)
构建版本
freebora-0.1.0-py3-none-any.whl (6.3 kB 查看哈希值)
关闭
freebora-0.1.0.tar.gz的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 4361dc67fb9210ce09bc10b55f9ce034c794edca4724fda9585a0de393b324d3 |
|
MD5 | f6bacbbe62cb0a06ced137022d28dbca |
|
BLAKE2b-256 | ea2ac4c79bc8f7ebfc512c3b5c06c8d6ea9292fdf5b862ebedd54fd53453b31e |
关闭
freebora-0.1.0-py3-none-any.whl的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | f1989b0c37598dbdc8dcd1d71bb5384455f5b2ad78740f0bd0dd4b5ba09ef932 |
|
MD5 | 2c0052ede580c3ca647b893ebde6b2e7 |
|
BLAKE2b-256 | 5c91fb31ddaaa2eb3f00729bb8a38e92a23bd324cf98c58c6a2266681a13565c |