DVC的数据管理子系统
项目描述
功能
待办事项
需求
待办事项
安装
$ pip install dvc-data
使用方法
HashFile
HashFile
基于dvc-object的Object,这是一个具有特定哈希的对象,可用于验证其内容。类似于git的ShaFile。
from dvc_data.hashfile import HashFile
obj = HashFile("/path/to/file", fs, HashInfo("md5", "36eba1e1e343279857ea7f69a597324e")
HashFileDB
基于dvc-object的ObjectDB,但存储HashFile对象,因此可以通过其hash_info来验证其内容。类似于git的ObjectStore。
from dvc_data.hashfile import HashFileDB
odb = HashFileDB(fs, "/path/to/odb")
索引
索引
一种类似字典树的结构,用于表示数据文件和目录。
from dvc_data.index import DataIndex, DataIndexEntry
index = DataIndex()
index[("foo",)] = DataIndexEntry(hash_info=hash_info, meta=meta)
存储
一个映射,描述了如何找到索引条目的数据内容。可以是基于HashFileDB的存储的ObjectStorage,或者用于备份的类似普通文件存储的FileStorage。
index.storage_map[("foo",)] = ObjectStorage(...)
贡献
非常欢迎贡献。要了解更多信息,请参阅贡献指南。
许可
在Apache 2.0许可下分发,DVC数据是免费和开源软件。
问题
如果您遇到任何问题,请附上详细描述提交问题。
项目详情
下载文件
下载适用于您平台文件的文件。如果您不确定选择哪个,请了解更多关于安装包的信息。
源分发
dvc_data-3.16.6.tar.gz (81.8 kB 查看哈希值)
构建分发
dvc_data-3.16.6-py3-none-any.whl (78.0 kB 查看哈希值)