MDAnalysis示例数据
项目描述
MDAnalysisData
访问MDAnalysis工作坊和扩展测试的数据。
数据集存储在外部稳定URL上(例如,在figshare、zenodo或DataDryad上),该软件包提供了一个简单的界面来下载、缓存和访问数据集。
安装
使用时,安装该软件包
pip install --upgrade MDAnalysisData
或使用conda
安装
conda install --channel conda-forge mdanalysisdata
访问数据集
导入数据集并访问您选择的数据集
from MDAnalysisData import datasets
adk = datasets.fetch_adk_equilibrium()
返回的对象包含指向拓扑和轨迹文件路径的属性,以便您可以直接使用它,例如,与MDAnalysis一起使用
import MDAnalysis as mda
u = mda.Universe(adk.topology, adk.trajectory)
元数据对象还包含一个DESCR
属性,其中包含数据集的描述,包括相关引用。
print(adk.DESCR)
管理数据
数据在本地的data目录
~/MDAnalysis_data
中存储(即在用户的主目录中)。可以通过设置环境变量MDANALYSIS_DATA
来更改此位置,例如
export MDANALYSIS_DATA=/tmp/MDAnalysis_data
可以使用以下方式获取数据目录的位置
MDAnalysisData.base.get_data_home()
如果删除了数据目录,则数据将再次下载。在下载文件时,使用SHA256校验和检查数据文件完整性。
可以使用该函数擦除数据目录
MDAnalysisData.base.clear_data_home()
贡献新的数据集
请将新的数据集添加到MDAnalysisData。有关详细信息,请参阅贡献新数据集,但简而言之
- 在问题跟踪器中提出一个问题,描述您想添加的内容;这个问题将成为讨论的焦点,开发人员可以轻松提供建议
- 将数据存放在一个与开放数据兼容的存档中(首选CC0或CC-BY许可证)
- 在MDAnalysisData中编写访问器代码
致谢
本包仿照sklearn.datasets设计。它使用了来自sklearn.datasets
的代码(在BSD 3-clause许可证下)。
不包括数据;请参阅每个数据集的DESCR
属性以获取作者的、引用的和数据的许可信息。