跳转到主要内容

与INSPIRE-HEP的爬虫集成。

项目描述

https://img.shields.io/travis/inspirehep/inspire-crawler.svg https://img.shields.io/coveralls/inspirehep/inspire-crawler.svg https://img.shields.io/github/tag/inspirehep/inspire-crawler.svg https://img.shields.io/pypi/dm/inspire-crawler.svg https://img.shields.io/github/license/inspirehep/inspire-crawler.svg

使用scrapy项目HEPCrawl与INSPIRE-HEP进行爬虫集成。

此模块允许将爬虫作业调度到Scrapyd实例,该实例为Scrapy项目提供服务。例如,在这种情况下,默认的scrapy项目是HEPCrawl

它直接与invenio-workflows模块集成,为爬虫收集的每个记录创建工作流程。

此模块仅适用于INSPIRE-HEP覆盖。 风险自担。

完整文档托管在此: http://pythonhosted.org/inspire-crawler/

另请参阅HEPCrawl的文档: http://pythonhosted.org/hepcrawl/

项目详情


下载文件

下载适合您平台的文件。如果您不确定选择哪个,请了解更多关于安装包的信息。

源代码分发

inspire-crawler-3.0.4.tar.gz (35.4 kB 查看散列值)

上传时间 源代码

由以下机构支持

AWS AWS 云计算和安全赞助商 Datadog Datadog 监控 Fastly Fastly CDN Google Google 下载分析 Microsoft Microsoft PSF 赞助商 Pingdom Pingdom 监控 Sentry Sentry 错误日志 StatusPage StatusPage 状态页面