大数据包工具
项目描述
bdbag
大数据包工具
bdbag
工具是一系列软件程序,用于处理符合 BDBag 和 Bagit/RO 配置文件的 BagIt 包。
bdbag
配置文件 指定了 fetch.txt
文件的使用,要求序列化,并指定与 bdbag
一起提供的清单。
bdbag
工具整合了来自各种基于 Python 的 bagit
组件的功能(如 Bagit-Python 包创建工具和 Bagit-Profiles-Validator 工具),并将它们封装在一个易于使用的软件包中,并增加了额外功能。
增强的包支持包括
- 现有包的更新功能。
- 使用 ZIP、TAR 和 TGZ 格式自动存档和提取包。
- 通过配置文件自动生成文件清单条目和
fetch.txt
的远程文件。 - 根据包的
fetch.txt
文件内容自动检索文件,支持多种协议。提供http(s)
、ftp
、s3
、gs
和globus
的传输处理程序,并提供了添加外部开发传输的扩展机制。 - 内置
bagit-profile
验证。 - 支持创建与Bagit/RO配置文件兼容的包。
可在此处找到针对bdbag
的实验性图形用户界面(GUI)。
技术论文
"我将带走:大数据包和交换大型、复杂数据集的最小标识符"解释了BDBags和相关Minid构造的动机,提供了设计和实现的详细信息,并给出了使用示例。
"可重复的大数据科学:一个连续FAIR性案例研究"展示了一个数据分析用例,其中使用BDBags和Minids捕获转录因子结合位点分析。
Python依赖项
- 所需的最小Python版本是2.7。请注意,Python 2.7已正式停止维护,Python 2.7与
bdbag
(及其依赖项)之间的持续兼容性不受官方支持,也不能保证。 - 当前官方支持的是Python 3,版本3.8至3.12。
安装
最新版本的bdbag
可在PyPi上获取,并可以使用pip
进行安装
pip install bdbag
注意,上述命令将仅安装运行所需的最小依赖项。如果您希望使用由boto
(用于AWS S3)和globus
(用于Globus Transfer)包提供的额外fetch传输处理程序支持安装bdbag
,请使用以下命令
pip install bdbag[boto,globus]
从源代码安装
您可以使用pip
直接从GitHub安装bdbag
sudo pip install git+https://github.com/fair-research/bdbag
或者
pip install --user git+https://github.com/fair-research/bdbag
您也可以从GitHub下载当前的bdbag
源代码,或者如果您已安装git,则可以从GitHub克隆源代码
git clone https://github.com/fair-research/bdbag
在bdbag
源代码目录的根目录下执行以下命令
sudo pip install .
或者
pip install --user .
请注意,如果您想从本地源代码目录安装额外依赖项,请使用以下命令
pip install .[boto,globus]
测试
可以通过从bdbag
源代码目录的根目录调用以下命令来运行单元测试
python setup.py test
用法
此软件可以通过运行bdbag
脚本来在命令行环境中使用。有关详细的使用说明,请参阅CLI指南。
配置
可以通过JSON格式配置文件配置bdbag
软件的一些组件。有关详细信息,请参阅配置指南。
应用程序编程接口
还可以通过API在Python程序中调用bdbag
。有关详细信息,请参阅API指南。
实用工具
提供CLI实用工具模块,用于处理与编写bdbags
相关的各种辅助任务。有关详细信息,请参阅实用工具指南。
变更日志
变更日志位于此处。
项目详情
下载文件
下载您平台的文件。如果您不确定选择哪个,请了解更多关于 安装包 的信息。
源代码分发
构建分发
bdbag-1.7.3.tar.gz 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | a0d4294bcbfe2a437b88f61cebf0cc3c11b91e8c66da6d16e2abfde36d27d348 |
|
MD5 | 591be73d1e0c0a0d43b3cb8e46832f1b |
|
BLAKE2b-256 | 7f245f9fc900a7252c5e61a5ce39eb02ab0a5e546bc76ee14d5919b2181df1eb |
bdbag-1.7.3-py2.py3-none-any.whl 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 9071c256c9178eabf3bfcb238619e2246ea93f28239f35e918d75282b80633e7 |
|
MD5 | a38ba4ad6e8628490fc982b88e9d910d |
|
BLAKE2b-256 | ff7f4f9e6120d7e68d937076b67f20540674c4a43e346033a1a77f614d66aeec |