跳转到主要内容

DataLad扩展包,用于将外部网络资源爬取到自动化数据分发中

项目描述

 ____          _           _                 _
|  _ \   __ _ | |_   __ _ | |      __ _   __| |
| | | | / _` || __| / _` || |     / _` | / _` |
| |_| || (_| || |_ | (_| || |___ | (_| || (_| |
|____/  \__,_| \__| \__,_||_____| \__,_| \__,_|
                                   Crawler

Travis tests status codecov.io Documentation License: MIT GitHub release PyPI version fury.io Average time to resolve an issue Percentage of issues still open

此扩展增强了DataLad(《http://datalad.org》)的功能,使其能够将外部网络资源爬取到自动化数据分发中。有关附加命令和功能的说明,请参阅扩展文档

有关如何使用或贡献DataLad(以及此扩展)的详细信息,请参阅DataLad网站主GitHub项目页面

安装

在安装此软件包之前,请确保您已安装最新版本的git-annex(《https://git-annex.branchable.com/install》)。之后,从PyPi安装最新版本的datalad-crawler。建议使用专用virtualenv

# create and enter a new virtual environment (optional)
virtualenv --system-site-packages --python=python3 ~/env/datalad
. ~/env/datalad/bin/activate

# install from PyPi
pip install datalad_crawler

支持

本项目的文档在此处可以找到: http://docs.datalad.org/projects/crawler

有关此软件的所有错误、问题和改进请求都可以在此提交: https://github.com/datalad/datalad-crawler/issues

如果您在使用DataLad时遇到问题或想提问,请将问题提交至NeuroStars.org,并添加datalad标签。NeuroStars.org是一个类似StackOverflow的平台,专注于神经信息学。

所有以前的DataLad问题都可以在这里找到:http://neurostars.org/tags/datalad/

致谢

DataLad的开发得到了美国-德国计算神经科学(CRCNS)项目“DataGit:将目录、仓库和部署物流融合到一个联邦的‘数据分发’”的支持(Halchenko/Hanke),该项目由美国国家科学基金会(NSF 1429999)和德国联邦教育与研究部(BMBF 01GQ1411)共同资助。此外,德国萨克森-安哈尔特州和欧洲区域发展基金(ERDF)也提供了支持,项目:行为脑科学中心,成像平台。该工作还得到了ReproNim项目(NIH 1P41EB019936-01A1)的进一步促进。

项目详情


下载文件

下载适合您平台文件。如果您不确定该选择哪个,请了解更多关于安装包的信息。

源分布

datalad_crawler-1.0.2.tar.gz (116.4 kB 查看哈希值)

上传时间

构建分布

datalad_crawler-1.0.2-py3-none-any.whl (147.7 kB 查看哈希值)

上传时间 Python 3

支持者

AWS AWS 云计算和安全赞助商 Datadog Datadog 监控 Fastly Fastly CDN Google Google 下载分析 Microsoft Microsoft PSF 赞助商 Pingdom Pingdom 监控 Sentry Sentry 错误记录 StatusPage StatusPage 状态页面