跳转到主要内容

将WAV文件转换为Mel频谱图

项目描述

wav2mel

将WAV音频[1]转换为Mel频谱图,用于像Tacotron2这样的机器学习系统。

此库包含WAV到Mel转换中到处可见的复制粘贴代码的部分。

[1] 或任何由librosa(它使用soundfileaudioread)支持的音频格式。

安装

pip install wav2mel

依赖项

  • Python 3.6或更高版本
  • librosa, numpy, scipy, numba

格式

wav2mel输出numpy保存数据:每个输入文件一个.npy文件。

用法

您可以按照以下方式将单个WAVE文件从.wav转换为mel频谱图(.npy

wav2mel < WAVE_FILE > NPY_FILE

也可以将多个WAVE文件转换为并保存到目录中

wav2mel --output-dir /path/to/mels WAVE_FILE [WAVE_FILE ...]

每个.npy文件将被命名为相应的.wav文件。

请参阅wav2mel --help获取更多选项(过滤器/跳长/窗口长度,采样率等)。

使用GNU Parallel

find /path/to/wavs -name '*.wav' -type f | parallel -X wav2mel --output-dir /path/to/mels

mel2wav (Griffin-Lim)

您还可以使用griffin-lim将mel频谱图转换为WAV音频

mel2wav < NPY_FILE > WAVE_FILE

mel2wav --output-dir /path/to/wavs NPY_FILE [NPY_FILE ...]

请参阅mel2wav --help获取更多选项。

项目详情


下载文件

下载适合您平台的文件。如果您不确定选择哪个,请了解有关安装包的更多信息。

源分布

wav2mel-0.3.0.tar.gz (7.2 kB 查看哈希值)

上传时间:

支持者