为Project Pythia示例/notebooks提供访问数据仓库的实用函数
项目描述
CI | |
---|---|
文档 | |
包 | |
许可 |
pythia-datasets
Project Pythia示例/notebooks的数据仓库
样本数据集
这些文件用作Pythia项目示例/notebooks的样本数据,并由pythia_datasets
包下载
NARR_19930313_0000.nc
enso_data.csv
jan-17-co-asos.txt.xz
CESM2_sst_data.nc
CESM2_grid_variables.nc
添加新数据集
要添加新的数据集文件,请按照以下步骤操作
- 将数据集文件添加到
data/
目录 - 从命令行运行
python make_registry.py
脚本以更新位于pythia_datasets/registry.txt
中的注册文件 - 将更改提交并推送到GitHub
在笔记本和/或脚本中使用数据集
-
确保您的环境中已安装
pythia_datasets
包python -m pip install pythia-datasets # or python -m pip install git+https://github.com/ProjectPythia/pythia-datasets
-
导入
DATASETS
并检查注册表以查找可用的数据集In [1]: from pythia_datasets import DATASETS In [2]: DATASETS.registry_files Out[2]: ['jan-17-co-asos.txt.xz', 'NARR_19930313_0000.nc']
-
要获取感兴趣的数据文件,请使用
.fetch
方法并提供数据文件名。这将- 如果文件不存在,则下载并缓存文件。
- 检索并返回本地路径
In [4]: filepath = DATASETS.fetch('jan-17-co-asos.txt.xz') In [5]: filepath Out[5]: '/Users/abanihi/Library/Caches/pythia-datasets/jan-17-co-asos.txt.xz'
-
一旦您有了本地文件路径,您就可以使用它将数据集加载到pandas、xarray或您选择的任何包中
In [6]: df = pd.read_csv(filepath)
项目详情
下载文件
下载适用于您的平台的文件。如果您不确定选择哪个,请了解有关安装包的更多信息。
源分布
pythia-datasets-2021.9.21.tar.gz (12.0 kB 查看散列)
构建分布
关闭
pythia-datasets-2021.9.21.tar.gz的散列
算法 | 散列摘要 | |
---|---|---|
SHA256 | 19fcb86b0db71aa3251dcab528b51bf66639e2dc3c8654d6fc80b8a3379ac650 |
|
MD5 | 28aa736e264964a7699031ce22b102d9 |
|
BLAKE2b-256 | 0b45fd687d08636413a2b612b56ce67e83fe1724158a962199d9fc6e45f04d5b |
关闭
pythia-datasets-2021.9.21-py3-none-any.whl的散列
算法 | 散列摘要 | |
---|---|---|
SHA256 | 179dbe46538ad2310fd11075472807c425ffa956db6b90957d52211e22441f5b |
|
MD5 | 2c6f7fc3afb67dc36253c5b152d26516 |
|
BLAKE2b-256 | e540fc8ffc2c2fb3bbb0dec75bec4a5fb5336f035ceafac5397400f9c2b12dab |