PyTorch的音频包

项目描述

torchaudio：PyTorch的音频库

TorchAudio Logo

torchaudio的目标是将PyTorch应用于音频领域。通过支持PyTorch，torchaudio遵循相同的理念，提供强大的GPU加速，通过autograd系统专注于可训练的特征，并保持一致的风格（张量名称和维度名称）。因此，它主要是一个机器学习库，而不是通用的信号处理库。PyTorch的好处可以通过所有计算都通过PyTorch操作来实现，这使得它易于使用，感觉像是自然扩展。

支持音频I/O（加载文件、保存文件）
- 使用SoX加载多种音频格式，如wav、mp3、ogg、flac、opus、sphere，到torch Tensor
- Kaldi (ark/scp)
常见音频数据集的加载器
音频和语音处理函数
- forced_align
常见的音频转换
- 频谱图、振幅转dB、梅尔尺度、梅尔频谱图、MFCC、MuLaw编码、MuLaw解码、重采样
合规接口：运行与其它库兼容的PyTorch代码
- Kaldi：频谱图、fbank、mfcc

安装

请参阅https://pytorch.ac.cn/audio/main/installation.html了解TorchAudio的安装和构建过程。

API参考

API参考位于此处：https://pytorch.ac.cn/audio/main/

贡献指南

请参阅CONTRIBUTING.md

引用

如果您觉得这个包很有用，请按照以下方式引用：

@article{yang2021torchaudio,
  title={TorchAudio: Building Blocks for Audio and Speech Processing},
  author={Yao-Yuan Yang and Moto Hira and Zhaoheng Ni and Anjali Chourdia and Artyom Astafurov and Caroline Chen and Ching-Feng Yeh and Christian Puhrsch and David Pollack and Dmitriy Genzel and Donny Greenberg and Edward Z. Yang and Jason Lian and Jay Mahadeokar and Jeff Hwang and Ji Chen and Peter Goldsborough and Prabhat Roy and Sean Narenthiran and Shinji Watanabe and Soumith Chintala and Vincent Quenneville-B��lair and Yangyang Shi},
  journal={arXiv preprint arXiv:2110.15018},
  year={2021}
}

@misc{hwang2023torchaudio,
      title={TorchAudio 2.1: Advancing speech recognition, self-supervised learning, and audio processing components for PyTorch}, 
      author={Jeff Hwang and Moto Hira and Caroline Chen and Xiaohui Zhang and Zhaoheng Ni and Guangzhi Sun and Pingchuan Ma and Ruizhe Huang and Vineel Pratap and Yuekai Zhang and Anurag Kumar and Chin-Yun Yu and Chuang Zhu and Chunxi Liu and Jacob Kahn and Mirco Ravanelli and Peng Sun and Shinji Watanabe and Yangyang Shi and Yumeng Tao and Robin Scheibler and Samuele Cornell and Sean Kim and Stavros Petridis},
      year={2023},
      eprint={2310.17864},
      archivePrefix={arXiv},
      primaryClass={eess.AS}
}

数据集免责声明

这是一个下载和准备公共数据集的实用库。我们不托管或分发这些数据集，不保证其质量或公正性，也不声称您有权使用这些数据集。您有责任确定您是否可以按照数据集的许可证使用该数据集。

如果您是数据集的所有者，并希望更新其任何部分（描述、引用等），或者不希望您的数据集包含在此库中，请通过GitHub问题与我们联系。感谢您对机器学习社区的贡献！

预训练模型许可证

此库中提供的预训练模型可能有其自己的许可证或由训练所使用的数据集派生的条款和条件。您有责任确定您是否有权根据您的使用案例使用这些模型。

例如，SquimSubjective模型是在Creative Commons Attribution Non Commercial 4.0 International (CC-BY-NC 4.0)许可证下发布的。请参阅此链接获取更多详细信息。

具有不同许可证的其他预训练模型已在文档中注明。请查看文档页面。

项目详情

发行历史发布通知 | RSS订阅

本版本

2.4.1

2024年9月4日

2.4.0

2024年7月24日

2.3.1

2024年6月5日

2.3.0

2024年4月24日

2.2.2

2024年3月27日

2.2.1

2024年2月22日

2.2.0

2024年1月30日

2.1.2

2023年12月14日

2.1.1

2023年11月15日

2.1.0

2023年10月4日

2.0.2

2023年5月8日

2.0.1

2023年3月15日

2.0.0 已撤销

2023年3月15日

撤销此版本的原因

包含错误的torch依赖项

0.13.1

2022年12月15日

0.13.0

2022年10月28日

0.12.1

2022年8月5日

0.12.0

2022年6月28日

0.11.0

2022年3月10日

0.10.2

2022年1月27日

0.10.1

2021年12月15日

0.10.0

2021年10月21日

0.9.1

2021年9月20日

0.9.0

2021年6月15日

0.8.1

2021年3月25日

0.8.0

2021年3月4日

0.7.2

2020年12月10日

0.7.0

2020年10月27日

0.6.0

2020年7月28日

0.5.1

2020年6月18日

0.5.0

2020年4月21日

0.4.0

2020年1月16日

0.3.2

2020年1月9日

0.3.1

2019年10月17日

0.3.0

2019年8月8日

下载文件

下载适合您平台的文件。如果您不确定选择哪个，请了解更多关于安装包的信息。

源代码发行版

此版本没有可用的源代码发行版文件。请参阅生成发行版存档的教程。

构建发行版

torchaudio-2.4.1-cp312-cp312-win_amd64.whl (2.4 MB 查看哈希值)

上传时间 2024年9月4日 CPython 3.12 Windows x86-64

torchaudio-2.4.1-cp312-cp312-manylinux2014_aarch64.whl (1.7 MB 查看哈希值)

上传时间 2024年9月4日 CPython 3.12

torchaudio-2.4.1-cp312-cp312-manylinux1_x86_64.whl (3.4 MB 查看哈希值)

上传时间 2024年9月4日 CPython 3.12

torchaudio-2.4.1-cp312-cp312-macosx_11_0_arm64.whl (1.8 MB 查看哈希值)

上传时间 2024年9月4日 CPython 3.12 macOS 11.0+ ARM64

torchaudio-2.4.1-cp311-cp311-win_amd64.whl (2.4 MB 查看哈希值)

上传时间 2024年9月4日 CPython 3.11 Windows x86-64

torchaudio-2.4.1-cp311-cp311-manylinux2014_aarch64.whl (1.7 MB 查看哈希值)

上传时间 2024年9月4日 CPython 3.11

torchaudio-2.4.1-cp311-cp311-manylinux1_x86_64.whl (3.4 MB 查看哈希值)

上传时间 2024年9月4日 CPython 3.11

torchaudio-2.4.1-cp311-cp311-macosx_11_0_arm64.whl (1.8 MB 查看哈希值)

上传时间：2024年9月4日 CPython 3.11 macOS 11.0+ ARM64

torchaudio-2.4.1-cp310-cp310-win_amd64.whl (2.4 MB 查看哈希值)

上传时间：2024年9月4日 CPython 3.10 Windows x86-64

torchaudio-2.4.1-cp310-cp310-manylinux2014_aarch64.whl (1.7 MB 查看哈希值)

上传时间：2024年9月4日 CPython 3.10

torchaudio-2.4.1-cp310-cp310-manylinux1_x86_64.whl (3.4 MB 查看哈希值)

上传时间：2024年9月4日 CPython 3.10

torchaudio-2.4.1-cp310-cp310-macosx_11_0_arm64.whl (1.8 MB 查看哈希值)

上传时间：2024年9月4日 CPython 3.10 macOS 11.0+ ARM64

torchaudio-2.4.1-cp39-cp39-win_amd64.whl (2.4 MB 查看哈希值)

上传时间：2024年9月4日 CPython 3.9 Windows x86-64

torchaudio-2.4.1-cp39-cp39-manylinux2014_aarch64.whl (1.7 MB 查看哈希值)

上传时间：2024年9月4日 CPython 3.9

torchaudio-2.4.1-cp39-cp39-manylinux1_x86_64.whl (3.4 MB 查看哈希值)

上传时间：2024年9月4日 CPython 3.9

torchaudio-2.4.1-cp39-cp39-macosx_11_0_arm64.whl (1.8 MB 查看哈希值)

上传时间：2024年9月4日 CPython 3.9 macOS 11.0+ ARM64

torchaudio-2.4.1-cp38-cp38-win_amd64.whl (2.4 MB 查看哈希值)

上传时间：2024年9月4日 CPython 3.8 Windows x86-64

torchaudio-2.4.1-cp38-cp38-manylinux2014_aarch64.whl (1.7 MB 查看哈希值)

上传时间：2024年9月4日 CPython 3.8

torchaudio-2.4.1-cp38-cp38-manylinux1_x86_64.whl (3.4 MB 查看哈希值)

上传于 2024年9月4日 CPython 3.8

torchaudio-2.4.1-cp38-cp38-macosx_11_0_arm64.whl (1.8 MB 查看哈希值)

上传于 2024年9月4日 CPython 3.8 macOS 11.0+ ARM64

torchaudio-2.4.1-cp312-cp312-win_amd64.whl 的哈希值

torchaudio-2.4.1-cp312-cp312-win_amd64.whl 的哈希值
算法	哈希摘要
SHA256	`d721b186aae7bd8752c9ad95213f5d650926597bb9060728dfe476986a1ff570`
MD5	`85e522f272e464d69ee98843a77e71e2`
BLAKE2b-256	`9bf5d3c9b0ba802e2b8e363c5366b37b6b5fb703ac052a5afc334c36b255401f`

torchaudio-2.4.1-cp312-cp312-manylinux2014_aarch64.whl 的哈希值

torchaudio-2.4.1-cp312-cp312-manylinux2014_aarch64.whl 的哈希值
算法	哈希摘要
SHA256	`5b62fc7b16ed708b0c07d4393137797e92f63fc3bd5705607d97ba6a9a7cf3f0`
MD5	`57c00e73405172d61cb94741c74a5ac6`
BLAKE2b-256	`7ad04835f9f6d8ea26b633c6331aaff40d9ac52b26bd3e72d91d40f9c83ff5a1`

torchaudio-2.4.1-cp312-cp312-manylinux1_x86_64.whl 的哈希值

torchaudio-2.4.1-cp312-cp312-manylinux1_x86_64.whl 的哈希值
算法	哈希摘要
SHA256	`1796a8961decb522c47daab0fbe27c057d6d143ee22bb6ae0d5eb9b2a038c7b6`
MD5	`8b907248c70ed67b8530c652bb42fd83`
BLAKE2b-256	`590c2eaf389ebb377febaef128bce57e7ebdfb5375b959163dd936c06941fe59`

torchaudio-2.4.1-cp312-cp312-macosx_11_0_arm64.whl 的哈希值

torchaudio-2.4.1-cp312-cp312-macosx_11_0_arm64.whl 的哈希值
算法	哈希摘要
SHA256	`953946cf610ffd57bb3fdd228effa2112fa51c5dfe36a96611effc9074a3d3be`
MD5	`544d805268e1a02301082ed846a01fa5`
BLAKE2b-256	`f763ca0921398395834db67c52e2a0d0a4edec8077875c8ef825cb1ef81b86f7`

torchaudio-2.4.1-cp311-cp311-win_amd64.whl 的哈希值

torchaudio-2.4.1-cp311-cp311-win_amd64.whl 的哈希值
算法	哈希摘要
SHA256	`3c08b42a0c296c8eeee6c533bcae5cfbc0ceae86a34f24fe6bbbb5faa7a7bea1`
MD5	`c352dfc3596fdcc90096bc1043b4c36c`
BLAKE2b-256	`b7ba6dde28d32906dba5e9a1b240c9b328f564ce3ac020c0f159cc13c2d47d9d`

torchaudio-2.4.1-cp311-cp311-manylinux2014_aarch64.whl 的哈希值

torchaudio-2.4.1-cp311-cp311-manylinux2014_aarch64.whl 的哈希值
算法	哈希摘要
SHA256	`7640aaffb2056e12f2906187b03a22228a0908c87d0295fddf4b0b92334a290b`
MD5	`1ae02dfcabcb8b5aa008f01fc24f3918`
BLAKE2b-256	`086b1fc20455bd0c095eb11240c74d074bfd96048276826c0b25972f7bcdb5fa`

torchaudio-2.4.1-cp311-cp311-manylinux1_x86_64.whl 的哈希值

torchaudio-2.4.1-cp311-cp311-manylinux1_x86_64.whl 的哈希值
算法	哈希摘要
SHA256	`95a0968569f7f4455bfd242bfcd489ec47ad37d2ba0f3d9f738cd1128a5f775c`
MD5	`aee5d295f9902f27e6a88c1ad29a9602`
BLAKE2b-256	`ccf3a950329a25ee1af14c05065ce6c1751f031de9e6d5eebb0620ce3d0938ed`

torchaudio-2.4.1-cp311-cp311-macosx_11_0_arm64.whl 的哈希值

torchaudio-2.4.1-cp311-cp311-macosx_11_0_arm64.whl 的哈希值
算法	哈希摘要
SHA256	`60af1531815d22659e5412ea401bed552a16c389938c49664e446e4cfd5ddc06`
MD5	`16fe175722600f9318a633ad00f581a1`
BLAKE2b-256	`bb284fddff9db2d0c5fb1c764a56d69ebe42858c388d1c2a1224cc5f3309def4`

torchaudio-2.4.1-cp310-cp310-win_amd64.whl 的哈希值

torchaudio-2.4.1-cp310-cp310-win_amd64.whl 的哈希值
算法	哈希摘要
SHA256	`dec97872215c3122b7718ec47ac63e143565c3cced06444d0225e98bf4dd4b5f`
MD5	`a499134b2f3c85f5e37daa415397fc22`
BLAKE2b-256	`896cde1d69025456c14c4bc5e1a92967d3343ec95a7d3c9e211f8c01ea1eac5a`

torchaudio-2.4.1-cp310-cp310-manylinux2014_aarch64.whl 的哈希值

torchaudio-2.4.1-cp310-cp310-manylinux2014_aarch64.whl 的哈希值
算法	哈希摘要
SHA256	`54431179d9a9ccf3feeae98aace07d89fae9fd728e2bc8656efbd70e7edcc6f8`
MD5	`0f414cf154e7d1c86efc069a024615e6`
BLAKE2b-256	`f7bc9c48e9abe9a8f76b9880f94b2262def4d4390d59ba91db44412fadd8b8a2`

哈希值 for torchaudio-2.4.1-cp310-cp310-manylinux1_x86_64.whl

torchaudio-2.4.1-cp310-cp310-manylinux1_x86_64.whl 的哈希值
算法	哈希摘要
SHA256	`bfc234cef1d03092ea27440fb79e486722ccb41cff94ebaf9d5a1082436395fe`
MD5	`c8c9324feb351225e7c5dceceb5c4b35`
BLAKE2b-256	`06597b6911f0689b594c3bf7666ebc4079c6d6fba94533d4748f5844ec07cb09`

哈希值 for torchaudio-2.4.1-cp310-cp310-macosx_11_0_arm64.whl

torchaudio-2.4.1-cp310-cp310-macosx_11_0_arm64.whl 的哈希值
算法	哈希摘要
SHA256	`661909751909340b24f637410dfec02a888867816c3db19ed4f4102ae105244a`
MD5	`9ee0bbf799d56c996526d2cdf895f11a`
BLAKE2b-256	`5522a19bdd21fb79bc45602883712ef0beb46f67f45e9bd7af1693519b68f89f`

哈希值 for torchaudio-2.4.1-cp39-cp39-win_amd64.whl

torchaudio-2.4.1-cp39-cp39-win_amd64.whl 的哈希值
算法	哈希摘要
SHA256	`f46e34ab3866ad8d8ace0673cd11e697c5cde6a3b7a4d8d789207d4d8badbb6e`
MD5	`e56fcf2cbe7f535f19e20cf77f439589`
BLAKE2b-256	`fdbb56df51845629d28e78beeab61cfab8a3ca97564b807553554a25dca1bad4`

哈希值 for torchaudio-2.4.1-cp39-cp39-manylinux2014_aarch64.whl

torchaudio-2.4.1-cp39-cp39-manylinux2014_aarch64.whl 的哈希值
算法	哈希摘要
SHA256	`36c7e7bc6b358cbf42b769c80206780fa1497d141a985c6b3e7768de44524e9a`
MD5	`d21585bb1bf104561d3db90efc65ae3b`
BLAKE2b-256	`69f32ac0f41d1e281faf996fc9b86ab5d558507e177f9e0c4d2bc9261107c250`

哈希值 for torchaudio-2.4.1-cp39-cp39-manylinux1_x86_64.whl

torchaudio-2.4.1-cp39-cp39-manylinux1_x86_64.whl 的哈希值
算法	哈希摘要
SHA256	`98d8e03703f96b13a8d172d1ccdc7badb338227fd762985fdcea6b30f6697bdb`
MD5	`37ccbb908c01d2120f6ca20cabd7f1ce`
BLAKE2b-256	`25e27dfa8841d0d992726b8833d5ed8618ff4bb437423f0cf8916638b2186cf4`

哈希值 for torchaudio-2.4.1-cp39-cp39-macosx_11_0_arm64.whl

torchaudio-2.4.1-cp39-cp39-macosx_11_0_arm64.whl 的哈希值
算法	哈希摘要
SHA256	`3adce550850902b9aa6cd2378ccd720ac9ec8cf31e2eba9743ccc84ffcbe76d6`
MD5	`581ee42b8d912500bd0eaf35feb0877e`
BLAKE2b-256	`6f488748fe9155718a168c2f9357397e910ec5bd78620b6f7b9f986daf874485`

哈希值 for torchaudio-2.4.1-cp38-cp38-win_amd64.whl

torchaudio-2.4.1-cp38-cp38-win_amd64.whl 的哈希值
算法	哈希摘要
SHA256	`40e9fa8fdc8d328ea4aa90be65fd34c5ef975610dbd707545e3664393a8a2497`
MD5	`013742255968fb7f4e610c51308e78ed`
BLAKE2b-256	`39451509f486784ae07367abe47e08d7c5f4c2f08340ae3ce98821a1bdab849e`

哈希值 for torchaudio-2.4.1-cp38-cp38-manylinux2014_aarch64.whl

torchaudio-2.4.1-cp38-cp38-manylinux2014_aarch64.whl 的哈希值
算法	哈希摘要
SHA256	`74d19cf9ca3dad394afcabb7e6f7ed9ab9f59f2540d502826c7ec3e33985251d`
MD5	`bf71fb418765b93f2b25ba29f0266cb4`
BLAKE2b-256	`743061ce2912ddfbba0ed97cb291b7482cf9bd4592bd4dd7c5baa3c12502b081`

哈希值 for torchaudio-2.4.1-cp38-cp38-manylinux1_x86_64.whl

torchaudio-2.4.1-cp38-cp38-manylinux1_x86_64.whl 的哈希值
算法	哈希摘要
SHA256	`375d8740c8035a50faca7a5afe2fbdb712aa8733715b971b2af61b4003fa1c41`
MD5	`fb51bf25dbfae5f79287a219503a0c74`
BLAKE2b-256	`f061bd076dce5ef499a60074aab53af4ecc05b656678156c151fd814102253e3`

哈希值 for torchaudio-2.4.1-cp38-cp38-macosx_11_0_arm64.whl

torchaudio-2.4.1-cp38-cp38-macosx_11_0_arm64.whl 的哈希值
算法	哈希摘要
SHA256	`4ea0fd00142fe795c75bcc20a303981b56f2327c7f7d321b42a8fef1d78aafa9`
MD5	`d5d8c5b4742b08d6740cdd2c1b3ef3a4`
BLAKE2b-256	`26ca9b5c04754898d20ebdded3057465684236bc06697aeaa1a5df7dbcfaf0bc`

torchaudio 2.4.1

导航

验证详情

维护者

未验证详情

项目链接

元数据

分类器

项目描述

torchaudio：PyTorch的音频库

安装

API参考

贡献指南

引用

数据集免责声明

预训练模型许可证

项目详情

验证详情

维护者

未验证详情

项目链接

元数据

分类器

发行历史发布通知 | RSS订阅

下载文件

源代码发行版

构建发行版

torchaudio 2.4.1

导航

验证详情

维护者

未验证详情

项目链接

元数据

分类器

项目描述

torchaudio：PyTorch的音频库

安装

API参考

贡献指南

引用

数据集免责声明

预训练模型许可证

项目详情

验证详情

维护者

未验证详情

项目链接

元数据

分类器

发行历史 发布通知 | RSS订阅

下载文件

源代码发行版

构建发行版

发行历史发布通知 | RSS订阅