跳转到主要内容

PyTorch的音频包

项目描述

torchaudio:PyTorch的音频库

Documentation Anaconda Badge Anaconda-Server Badge

TorchAudio Logo

torchaudio的目标是将PyTorch应用于音频领域。通过支持PyTorch,torchaudio遵循相同的理念,提供强大的GPU加速,通过autograd系统专注于可训练的特征,并保持一致的风格(张量名称和维度名称)。因此,它主要是一个机器学习库,而不是通用的信号处理库。PyTorch的好处可以通过所有计算都通过PyTorch操作来实现,这使得它易于使用,感觉像是自然扩展。

安装

请参阅https://pytorch.ac.cn/audio/main/installation.html了解TorchAudio的安装和构建过程。

API参考

API参考位于此处:https://pytorch.ac.cn/audio/main/

贡献指南

请参阅CONTRIBUTING.md

引用

如果您觉得这个包很有用,请按照以下方式引用:

@article{yang2021torchaudio,
  title={TorchAudio: Building Blocks for Audio and Speech Processing},
  author={Yao-Yuan Yang and Moto Hira and Zhaoheng Ni and Anjali Chourdia and Artyom Astafurov and Caroline Chen and Ching-Feng Yeh and Christian Puhrsch and David Pollack and Dmitriy Genzel and Donny Greenberg and Edward Z. Yang and Jason Lian and Jay Mahadeokar and Jeff Hwang and Ji Chen and Peter Goldsborough and Prabhat Roy and Sean Narenthiran and Shinji Watanabe and Soumith Chintala and Vincent Quenneville-B��lair and Yangyang Shi},
  journal={arXiv preprint arXiv:2110.15018},
  year={2021}
}
@misc{hwang2023torchaudio,
      title={TorchAudio 2.1: Advancing speech recognition, self-supervised learning, and audio processing components for PyTorch}, 
      author={Jeff Hwang and Moto Hira and Caroline Chen and Xiaohui Zhang and Zhaoheng Ni and Guangzhi Sun and Pingchuan Ma and Ruizhe Huang and Vineel Pratap and Yuekai Zhang and Anurag Kumar and Chin-Yun Yu and Chuang Zhu and Chunxi Liu and Jacob Kahn and Mirco Ravanelli and Peng Sun and Shinji Watanabe and Yangyang Shi and Yumeng Tao and Robin Scheibler and Samuele Cornell and Sean Kim and Stavros Petridis},
      year={2023},
      eprint={2310.17864},
      archivePrefix={arXiv},
      primaryClass={eess.AS}
}

数据集免责声明

这是一个下载和准备公共数据集的实用库。我们不托管或分发这些数据集,不保证其质量或公正性,也不声称您有权使用这些数据集。您有责任确定您是否可以按照数据集的许可证使用该数据集。

如果您是数据集的所有者,并希望更新其任何部分(描述、引用等),或者不希望您的数据集包含在此库中,请通过GitHub问题与我们联系。感谢您对机器学习社区的贡献!

预训练模型许可证

此库中提供的预训练模型可能有其自己的许可证或由训练所使用的数据集派生的条款和条件。您有责任确定您是否有权根据您的使用案例使用这些模型。

例如,SquimSubjective模型是在Creative Commons Attribution Non Commercial 4.0 International (CC-BY-NC 4.0)许可证下发布的。请参阅此链接获取更多详细信息。

具有不同许可证的其他预训练模型已在文档中注明。请查看文档页面

下载文件

下载适合您平台的文件。如果您不确定选择哪个,请了解更多关于 安装包 的信息。

源代码发行版

此版本没有可用的源代码发行版文件。请参阅 生成发行版存档的教程

构建发行版

torchaudio-2.4.1-cp312-cp312-win_amd64.whl (2.4 MB 查看哈希值)

上传时间 CPython 3.12 Windows x86-64

torchaudio-2.4.1-cp312-cp312-manylinux2014_aarch64.whl (1.7 MB 查看哈希值)

上传时间 CPython 3.12

torchaudio-2.4.1-cp312-cp312-manylinux1_x86_64.whl (3.4 MB 查看哈希值)

上传时间 CPython 3.12

torchaudio-2.4.1-cp312-cp312-macosx_11_0_arm64.whl (1.8 MB 查看哈希值)

上传时间 CPython 3.12 macOS 11.0+ ARM64

torchaudio-2.4.1-cp311-cp311-win_amd64.whl (2.4 MB 查看哈希值)

上传时间 CPython 3.11 Windows x86-64

torchaudio-2.4.1-cp311-cp311-manylinux2014_aarch64.whl (1.7 MB 查看哈希值)

上传时间 CPython 3.11

torchaudio-2.4.1-cp311-cp311-manylinux1_x86_64.whl (3.4 MB 查看哈希值)

上传时间 CPython 3.11

torchaudio-2.4.1-cp311-cp311-macosx_11_0_arm64.whl (1.8 MB 查看哈希值)

上传时间: CPython 3.11 macOS 11.0+ ARM64

torchaudio-2.4.1-cp310-cp310-win_amd64.whl (2.4 MB 查看哈希值)

上传时间: CPython 3.10 Windows x86-64

torchaudio-2.4.1-cp310-cp310-manylinux2014_aarch64.whl (1.7 MB 查看哈希值)

上传时间: CPython 3.10

torchaudio-2.4.1-cp310-cp310-manylinux1_x86_64.whl (3.4 MB 查看哈希值)

上传时间: CPython 3.10

torchaudio-2.4.1-cp310-cp310-macosx_11_0_arm64.whl (1.8 MB 查看哈希值)

上传时间: CPython 3.10 macOS 11.0+ ARM64

torchaudio-2.4.1-cp39-cp39-win_amd64.whl (2.4 MB 查看哈希值)

上传时间: CPython 3.9 Windows x86-64

torchaudio-2.4.1-cp39-cp39-manylinux2014_aarch64.whl (1.7 MB 查看哈希值)

上传时间: CPython 3.9

torchaudio-2.4.1-cp39-cp39-manylinux1_x86_64.whl (3.4 MB 查看哈希值)

上传时间: CPython 3.9

torchaudio-2.4.1-cp39-cp39-macosx_11_0_arm64.whl (1.8 MB 查看哈希值)

上传时间: CPython 3.9 macOS 11.0+ ARM64

torchaudio-2.4.1-cp38-cp38-win_amd64.whl (2.4 MB 查看哈希值)

上传时间: CPython 3.8 Windows x86-64

torchaudio-2.4.1-cp38-cp38-manylinux2014_aarch64.whl (1.7 MB 查看哈希值)

上传时间: CPython 3.8

torchaudio-2.4.1-cp38-cp38-manylinux1_x86_64.whl (3.4 MB 查看哈希值)

上传于 CPython 3.8

torchaudio-2.4.1-cp38-cp38-macosx_11_0_arm64.whl (1.8 MB 查看哈希值)

上传于 CPython 3.8 macOS 11.0+ ARM64

由以下机构支持

AWS AWS 云计算和安全赞助商 Datadog Datadog 监控 Fastly Fastly CDN Google Google 下载分析 Microsoft Microsoft PSF 赞助商 Pingdom Pingdom 监控 Sentry Sentry 错误日志 StatusPage StatusPage 状态页面