为PyTorch提供的可组合数据加载模块
项目描述
TorchData (请参阅下面对当前状态的说明)
什么是TorchData? | 有状态数据加载器 | 安装指南 | 贡献 | 许可证
:warning: 2024年6月状态更新:移除DataPipes和DataLoader V2
我们正在将torchdata仓库的重心转向对torch.utils.data.DataLoader的迭代式增强。我们不再计划继续开发或维护[DataPipes
]和[DataLoaderV2
]解决方案,并将从torchdata仓库中移除它们。我们还将重新审视pytorch/pytorch中的DataPipes
引用。在torchdata==0.8.0
(2024年7月)版本中,它们将被标记为已弃用,并在0.9.0(2024年10月)版本中删除。建议现有用户在迁移完成之前将版本锁定在torchdata==0.8.0
或更早版本。后续版本将不会包含DataPipes或DataLoaderV2。旧版本的README文件可在此处找到。如有建议或意见,请提出(请使用#1196进行反馈)。
什么是TorchData?
TorchData项目是对PyTorch的torch.utils.data.DataLoader以及torch.utils.data.Dataset/IterableDataset的迭代式增强,以使其成为可扩展、高性能的数据加载解决方案。我们将在torchdata仓库下对这些增强进行迭代。
我们的第一个更改是从torch.utils.data.DataLoader中添加检查点功能,这可以在stateful_dataloader中找到,它是torch.utils.data.DataLoader的替代品,通过定义load_state_dict
和state_dict
方法,使中期epoch检查点成为可能,并为用户提供API以跟踪自定义迭代进度,以及其他自定义状态,如token缓冲区和/或RNG状态。
有状态的数据加载器
torchdata.stateful_dataloader.StatefulDataLoader
是torch.utils.data.DataLoader的替代品,它提供了state_dict和load_state_dict功能。有关更多信息示例,请参阅有状态数据加载器主页。还可以查看此Colab笔记本中的示例。
安装
版本兼容性
以下是相应的torchdata
版本和支持的Python版本。
torch |
torchdata |
python |
---|---|---|
master / nightly |
main / nightly |
>=3.8 , <=3.11 |
2.0.0 |
0.6.0 |
>=3.8 , <=3.11 |
1.13.1 |
0.5.1 |
>=3.7 , <=3.10 |
1.12.1 |
0.4.1 |
>=3.7 , <=3.10 |
1.12.0 |
0.4.0 |
>=3.7 , <=3.10 |
1.11.0 |
0.3.0 |
>=3.7 , <=3.10 |
本地pip或conda
首先,设置一个环境。我们将安装PyTorch二进制文件以及torchdata。如果你使用conda,创建一个conda环境
conda create --name torchdata
conda activate torchdata
如果你希望使用venv
而不是
python -m venv torchdata-env
source torchdata-env/bin/activate
安装torchdata
使用pip
pip install torchdata
使用conda
conda install -c pytorch torchdata
从源
pip install .
如果在从源构建TorchData失败的情况下,请按照贡献页面中提供的链接安装PyTorch的nightly版本。
从nightly
TorchData的nightly版本也提供,并从主分支每天更新。
使用pip
pip install --pre torchdata --extra-index-url https://download.pytorch.org/whl/nightly/cpu
使用conda
conda install torchdata -c pytorch-nightly
贡献
我们欢迎PR!请参阅CONTRIBUTING文件。
beta使用和反馈
我们很高兴听到早期采用者的意见,并与他们合作完善我们的设计。如果你对使用此工具对项目感兴趣,请提出问题。
许可证
TorchData采用BSD许可,如LICENSE文件中所述。
项目详情
哈希值 for torchdata-0.8.0-cp312-cp312-manylinux1_x86_64.whl
算法 | 哈希摘要 | |
---|---|---|
SHA256 | bb878e243e58526a5b3ac54583f7c029ad643a34ade798800c1878c83f1c36ee |
|
MD5 | ef8c30a3dd5da1aabbc808f895829013 |
|
BLAKE2b-256 | ea94d9ac51405d4259094dfa0a1dc3fa4ed2efe057d194873c9f1ba1881b06c9 |
哈希值 for torchdata-0.8.0-cp312-cp312-macosx_11_0_arm64.whl
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 4e3f7efac3d8a4bd4efcb1427869c04043d0a0a019f9aa1eb381bd6c6b321e62 |
|
MD5 | 856b648d5c515a52463d03de0b87b77e |
|
BLAKE2b-256 | 3ef72d1cd02ebcca73ff151dd94b0a08d30808574d944a360470b52a89f0be4e |
哈希值 for torchdata-0.8.0-cp311-cp311-manylinux1_x86_64.whl
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 2d63d3fdcc68cf912c81709c8704b9cf435ba89bceed41a365e7362eb5740394 |
|
MD5 | 1a33eb786b4c815b31be7b8b04bc6e52 |
|
BLAKE2b-256 | 64e8c691e8e73dc6cbb09ba84ffb0341a6466d3184ff422cda07ebade3b929ef |
哈希值 for torchdata-0.8.0-cp311-cp311-macosx_11_0_arm64.whl
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 1635cecf4226fec8539c5d06ba764a48c41363ea0bbea09407ab379828527a8b |
|
MD5 | 91ed3bfa5583eec531176ca04de22957 |
|
BLAKE2b-256 | 82aa4da6c725b03fb51c5a10405803308afd43970e66aad45e8cca872786ba1b |
哈希值 用于 torchdata-0.8.0-cp310-cp310-manylinux1_x86_64.whl
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 44f7875a62f3fab86e2f8e5af92c4929f8f7390aa17bd697fdd0965723bc1e98 |
|
MD5 | 9edd2879da701f63b0d143675bc16d26 |
|
BLAKE2b-256 | da90058fe345dfac8b50d2d0fdb421ce04c78c88b06a5f220dd8d64d424ccdbe |
哈希值 用于 torchdata-0.8.0-cp310-cp310-macosx_11_0_arm64.whl
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 082e27b2acb1768cb6a30ddd2f8d9c68e407164ce207194bf8bfa616d621a801 |
|
MD5 | 6cc714d87ced89c4be2254456d29f5d6 |
|
BLAKE2b-256 | 158a3251c64214ab09d1c1756677f36e78f8cf0ce9dabb3a21386e78ef50540e |
哈希值 用于 torchdata-0.8.0-cp39-cp39-manylinux1_x86_64.whl
算法 | 哈希摘要 | |
---|---|---|
SHA256 | deb712116bf643b89b368c41bbdee57432eaf2562fe4623dea15a86d47bb81bc |
|
MD5 | de4ef9f4f9feceda790461d6548d9921 |
|
BLAKE2b-256 | c4e264dd3b44b51cf8a7e5d5f7021808e173d45fb3aed0f3cb3da186d043a8e8 |
哈希值 用于 torchdata-0.8.0-cp39-cp39-macosx_11_0_arm64.whl
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 4dfeb0b01ae9db334b4daf93b4ee9ab1d83215382a80aa293f40f348e263adb8 |
|
MD5 | 8dae0d3f1802860f082ff147a22eb9d5 |
|
BLAKE2b-256 | fd3a5095648d90cd889a2cdb83dfca0e1049a6c12b97e1f923daf19f051c4843 |
哈希值 用于 torchdata-0.8.0-cp38-cp38-manylinux1_x86_64.whl
算法 | 哈希摘要 | |
---|---|---|
SHA256 | dc265a5b10a4a431838918e1a1a76e2930c63f4aaaad6c62182fbe3ea6ea4bbf |
|
MD5 | f598dffef456e8462b448a29166a4c4d |
|
BLAKE2b-256 | cd62a343cc69d312988ba4d22557b64d64b7a7e07c05c8aa3b94be37ba0011ca |
哈希值 用于 torchdata-0.8.0-cp38-cp38-macosx_11_0_arm64.whl
算法 | 哈希摘要 | |
---|---|---|
SHA256 | a842fadc17016cd18dcc1ae94088a85904cb0e307e2838a630c45423e0d83f46 |
|
MD5 | d63aa734c50dcfa5bd5f17d9cff54357 |
|
BLAKE2b-256 | 0673dd642ada98ec8844f4653c52dfd2f4785a6d50f8783a89e5641cca7e3d9e |