跳转到主要内容

大数据:从众多开放数据平台下载数据。

项目描述

这会遍历我所知道的所有数据集。

for dataset in pluplusch():
    print(dataset)

您可以通过参数稍作调整。

pluplusch(catalogs = ['http://data.enseignementsup-recherche.gouv.fr'],
          cache_dir = '/lockers/tlevine_vol/dadawarehouse.thomaslevine.com/big/pluplusch')

如果您想不时保存数据目录元数据,您可以编写一个类似以下的crontab。

@weekly pluplusch --cache-dir ~/$(date --rfc-3339=date)

项目详情


下载文件

下载适用于您平台的应用程序。如果您不确定选择哪个,请了解更多关于安装包的信息。

源代码发行版

pluplusch-0.0.7.tar.gz (6.6 kB 查看哈希值)

上传时间: 源代码

支持者

AWS AWS 云计算和安全赞助商 Datadog Datadog 监控 Fastly Fastly CDN Google Google 下载分析 Microsoft Microsoft PSF 赞助商 Pingdom Pingdom 监控 Sentry Sentry 错误记录 StatusPage StatusPage 状态页面