简化Python音频特征提取。
项目描述
Spafe
简化Python音频特征提取
目录
结构
spafe旨在简化从单声道音频文件中提取特征。Spafe包括与滤波器组、频谱图、频率和倒谱特征相关的各种计算。该库具有以下结构:
滤波器组
- Bark滤波器组
- Gamma tone滤波器组
- 线性滤波器组
- Mel滤波器组
频谱图
- Bark频谱图
- CQT频谱图
- Erb频谱图
- Mel频谱图
特征
- Bark频率倒谱系数(BFCCs)
- 常数Q变换倒谱系数(CQCCs)
- Gamma tone频率倒谱系数(GFCCs)
- 线性频谱倒谱系数(LFCC)
- 线性预测系数(LPC)
- 梅尔频率倒谱系数(MFCC)
- 逆梅尔频率倒谱系数(IMFCC)
- 基于幅度谱根倒谱系数(MSRCC)
- 归一化伽马斜波倒谱系数(NGCC)
- 功率归一化倒谱系数(PNCC)
- 基于相位谱根倒谱系数(PSRCC)
- 感知线性预测系数(PLP)
- Rasta感知线性预测系数(RPLP)
使用spafe计算特征的理论可以用以下图表概括:
频率
- 主导频率
- 基频
安装
依赖关系
spafe需要
如果您想使用spafe的视觉模块/函数,您需要安装
- Matplotlib (>= 3.5.2)
安装指南
一旦您安装了依赖项,请使用以下安装选项之一。
从PyPI安装
- 要全新安装spafe
pip install spafe
- 要更新现有安装
pip install -U spafe
从Anaconda安装
- Spafe也适用于anaconda
conda install spafe
从源安装
- 您可以通过以下步骤从源代码构建spafe
git clone git@github.com:SuperKogito/spafe.git
cd spafe
python setup.py install
为什么使用Spafe?
与大多数现有的音频特征提取库(python_speech_features,SpeechPy,surfboard和Bob)不同,Spafe提供了更多关于频谱特征提取算法的选项,特别是
- Bark频率倒谱系数(BFCCs)
- 常数Q变换倒谱系数(CQCCs)
- Gamma tone频率倒谱系数(GFCCs)
- 功率归一化倒谱系数(PNCC)
- 基于相位谱根倒谱系数(PSRCC)
大多数现有库及其优点提供了对特征提取的出色实现,但遗憾的是,它们仅限于梅尔频率特征(MFCC),并且最多还包含 Bark 频率和线性预测系数。例如,Librosa包括各种算法的出色实现(仅包括 MFCC 和 LPC),基于 短时傅里叶变换(STFT),从理论上讲更准确,但比 Spafe 实现中使用的 离散傅里叶变换 慢。
如何使用
有关如何使用spafe的示例在各种文档中均有说明 https://superkogito.github.io/spafe。
!请确保您引用的是正确的文档版本。
贡献
欢迎并鼓励贡献。要了解有关如何为spafe做出贡献的更多信息,请参阅贡献指南
引用
-
如果您想将spafe作为软件引用,请引用在以下索引中使用的版本 Zenodo
Ayoub Malek,Hadrien Titeux,Stefano Borzì,Christian Heider Nielsen,Fabian-Robert Stöter,Hervé Bredin,Eryk Urbański & Kevin Mattheus Moerman。 (2023)。SuperKogito/spafe: v0.3.3 (v0.3.3)。 Zenodo。 https://doi.org/10.5281/zenodo.11396240
-
您还可以按以下方式引用spafe的论文
Malek, A. (2023)。Spafe:简化python音频特征提取。开源软件杂志,8(81),4739, https://doi.org/10.21105/joss.04739
项目详情
下载文件
下载您平台的文件。如果您不确定选择哪个,请了解有关安装软件包的更多信息。