跳转到主要内容

DVC的数据管理子系统

项目描述

PyPI Status Python Version License

Tests Codecov pre-commit Black

功能

  • 待办事项

需求

  • 待办事项

安装

您可以通过从pipPyPI安装DVC数据

$ pip install dvc-data

使用方法

HashFile

HashFile

基于dvc-object的Object,这是一个具有特定哈希的对象,可用于验证其内容。类似于git的ShaFile

from dvc_data.hashfile import HashFile

obj = HashFile("/path/to/file", fs, HashInfo("md5", "36eba1e1e343279857ea7f69a597324e")

HashFileDB

基于dvc-object的ObjectDB,但存储HashFile对象,因此可以通过其hash_info来验证其内容。类似于git的ObjectStore

from dvc_data.hashfile import HashFileDB

odb = HashFileDB(fs, "/path/to/odb")

索引

索引

一种类似字典树的结构,用于表示数据文件和目录。

from dvc_data.index import DataIndex, DataIndexEntry

index = DataIndex()
index[("foo",)] = DataIndexEntry(hash_info=hash_info, meta=meta)

存储

一个映射,描述了如何找到索引条目的数据内容。可以是基于HashFileDB的存储的ObjectStorage,或者用于备份的类似普通文件存储的FileStorage

index.storage_map[("foo",)] = ObjectStorage(...)

贡献

非常欢迎贡献。要了解更多信息,请参阅贡献指南

许可

Apache 2.0许可下分发,DVC数据是免费和开源软件。

问题

如果您遇到任何问题,请附上详细描述提交问题

项目详情


发布历史 发布通知 | RSS源

下载文件

下载适用于您平台文件的文件。如果您不确定选择哪个,请了解更多关于安装包的信息。

源分发

dvc_data-3.16.6.tar.gz (81.8 kB 查看哈希值)

上传时间

构建分发

dvc_data-3.16.6-py3-none-any.whl (78.0 kB 查看哈希值)

上传时间 Python 3

由以下机构支持