将WAV文件转换为Mel频谱图
项目描述
wav2mel
将WAV音频[1]转换为Mel频谱图,用于像Tacotron2这样的机器学习系统。
此库包含WAV到Mel转换中到处可见的复制粘贴代码的部分。
[1] 或任何由librosa(它使用soundfile和audioread)支持的音频格式。
安装
pip install wav2mel
依赖项
- Python 3.6或更高版本
- librosa, numpy, scipy, numba
格式
wav2mel
输出numpy保存数据:每个输入文件一个.npy
文件。
用法
您可以按照以下方式将单个WAVE文件从.wav
转换为mel频谱图(.npy
)
wav2mel < WAVE_FILE > NPY_FILE
也可以将多个WAVE文件转换为并保存到目录中
wav2mel --output-dir /path/to/mels WAVE_FILE [WAVE_FILE ...]
每个.npy
文件将被命名为相应的.wav
文件。
请参阅wav2mel --help
获取更多选项(过滤器/跳长/窗口长度,采样率等)。
使用GNU Parallel
find /path/to/wavs -name '*.wav' -type f | parallel -X wav2mel --output-dir /path/to/mels
mel2wav (Griffin-Lim)
您还可以使用griffin-lim将mel频谱图转换为WAV音频
mel2wav < NPY_FILE > WAVE_FILE
或
mel2wav --output-dir /path/to/wavs NPY_FILE [NPY_FILE ...]
请参阅mel2wav --help
获取更多选项。
项目详情
关闭
wav2mel-0.3.0.tar.gz 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | edcf5857d944fe455bfde33756fcb026206a30bf3763e6471fab78bcd76d2dd6 |
|
MD5 | 38e3a9b2f61791a6640671c8429171c4 |
|
BLAKE2b-256 | 2123662225310e6826c92fa013577c33f80c33dcb16075a197679e70cb6cbf3c |