Tensorflow的VGGish嵌入模型的PyTorch端口。

这些详情尚未由PyPI验证

项目链接

主页

项目描述

Torch VGGish

A PyTorch端口VGGish¹，用于音频分类模型的特征嵌入前端。权重直接从tensorflow模型迁移，因此使用torchvggish创建的嵌入将是相同的。

快速开始

有两种选择：您可以从PyPI安装最新稳定版本，或者克隆此存储库并安装。

# optional: create virtual env
cd torchvggish && python3 -m venv .env
source activate .env/bin/activate

pip install -i https://test.pypi.org/simple/ torchvggish==0.1

# OR get the latest version
git clone git@github.com:harritaylor/torchvggish.git
pip install -r requirements.txt

用法

从example wav文件创建嵌入的简单示例

from torchvggish import vggish, vggish_input

# Initialise model and download weights
embedding_model = vggish()
embedding_model.eval()

example = vggish_input.wavfile_to_examples("example.wav")
embeddings = embedding_model.forward(example)

1. S. Hershey et al.，《大规模音频分类的CNN架构》，在2017年国际声学、语音和信号处理会议（ICASSP）中，可获取：https://arxiv.org/abs/1609.09430，https://ai.google/research/pubs/pub45611

项目详情

这些详情尚未由PyPI验证

项目链接

主页

版本历史发布通知 | RSS源

此版本

0.2

2022年2月18日

0.1

2022年2月18日

下载文件

下载适合您平台的文件。如果您不确定选择哪个，请了解更多关于安装包的信息。

源分布

torchvggish-0.2.tar.gz (9.7 kB 查看哈希值)

上传时间： 2022年2月18日 源

哈希值 for torchvggish-0.2.tar.gz

torchvggish-0.2.tar.gz 的哈希值
算法	哈希摘要
SHA256	`fc4d7cc17db557867bf793625f8897f0fc0c6877be737df26ee7d9df6e4ce35f`
MD5	`d35be1004550d4a640705654e6ec8daf`
BLAKE2b-256	`1ac8162f65a3d6498d06bfae86839448e99ffa2fa9343f51dabfc8174e999942`

torchvggish 0.2

导航

验证详情

维护者

未验证详情

项目链接

元数据

分类器

项目描述

Torch VGGish

快速开始

用法

项目详情

验证详情

维护者

未验证详情

项目链接

元数据

分类器

版本历史发布通知 | RSS源

下载文件

源分布

torchvggish 0.2

导航

验证详情

维护者

未验证详情

项目链接

元数据

分类器

项目描述

Torch VGGish

快速开始

用法

项目详情

验证详情

维护者

未验证详情

项目链接

元数据

分类器

版本历史 发布通知 | RSS源

下载文件

源分布

版本历史发布通知 | RSS源