跳转到主要内容

简化Python音频特征提取。

项目描述

Spafe

简化Python音频特征提取

Build Status docs.rs License Python codecov codebeat badge PyPI version anaconda Downloads DOI DOI

目录

结构

spafe旨在简化从单声道音频文件中提取特征。Spafe包括与滤波器组、频谱图、频率和倒谱特征相关的各种计算。该库具有以下结构:

滤波器组

  • Bark滤波器组
  • Gamma tone滤波器组
  • 线性滤波器组
  • Mel滤波器组

频谱图

  • Bark频谱图
  • CQT频谱图
  • Erb频谱图
  • Mel频谱图

特征

  • Bark频率倒谱系数(BFCCs)
  • 常数Q变换倒谱系数(CQCCs)
  • Gamma tone频率倒谱系数(GFCCs)
  • 线性频谱倒谱系数(LFCC)
  • 线性预测系数(LPC)
  • 梅尔频率倒谱系数(MFCC)
  • 逆梅尔频率倒谱系数(IMFCC)
  • 基于幅度谱根倒谱系数(MSRCC)
  • 归一化伽马斜波倒谱系数(NGCC)
  • 功率归一化倒谱系数(PNCC)
  • 基于相位谱根倒谱系数(PSRCC)
  • 感知线性预测系数(PLP)
  • Rasta感知线性预测系数(RPLP)

使用spafe计算特征的理论可以用以下图表概括:

频率

  • 主导频率
  • 基频

安装

依赖关系

spafe需要

如果您想使用spafe的视觉模块/函数,您需要安装

安装指南

一旦您安装了依赖项,请使用以下安装选项之一。

从PyPI安装

  • 要全新安装spafe
pip install spafe
  • 要更新现有安装
pip install -U spafe

从Anaconda安装

  • Spafe也适用于anaconda
conda install spafe

从源安装

  • 您可以通过以下步骤从源代码构建spafe
git clone git@github.com:SuperKogito/spafe.git
cd spafe
python setup.py install

为什么使用Spafe?

与大多数现有的音频特征提取库(python_speech_featuresSpeechPysurfboardBob)不同,Spafe提供了更多关于频谱特征提取算法的选项,特别是

  • Bark频率倒谱系数(BFCCs)
  • 常数Q变换倒谱系数(CQCCs)
  • Gamma tone频率倒谱系数(GFCCs)
  • 功率归一化倒谱系数(PNCC)
  • 基于相位谱根倒谱系数(PSRCC)

大多数现有库及其优点提供了对特征提取的出色实现,但遗憾的是,它们仅限于梅尔频率特征(MFCC),并且最多还包含 Bark 频率和线性预测系数。例如,Librosa包括各种算法的出色实现(仅包括 MFCC 和 LPC),基于 短时傅里叶变换(STFT),从理论上讲更准确,但比 Spafe 实现中使用的 离散傅里叶变换 慢。

如何使用

有关如何使用spafe的示例在各种文档中均有说明 https://superkogito.github.io/spafe

!请确保您引用的是正确的文档版本。

贡献

欢迎并鼓励贡献。要了解有关如何为spafe做出贡献的更多信息,请参阅贡献指南

引用

  • 如果您想将spafe作为软件引用,请引用在以下索引中使用的版本 Zenodo

    Ayoub Malek,Hadrien Titeux,Stefano Borzì,Christian Heider Nielsen,Fabian-Robert Stöter,Hervé Bredin,Eryk Urbański & Kevin Mattheus Moerman。 (2023)。SuperKogito/spafe: v0.3.3 (v0.3.3)。 Zenodo。 https://doi.org/10.5281/zenodo.11396240

    DOI

  • 您还可以按以下方式引用spafe的论文

    Malek, A. (2023)。Spafe:简化python音频特征提取。开源软件杂志,8(81),4739, https://doi.org/10.21105/joss.04739

    DOI

项目详情


下载文件

下载您平台的文件。如果您不确定选择哪个,请了解有关安装软件包的更多信息。

源代码分发

spafe-0.3.3.tar.gz (51.3 kB 查看散列值

上传时间

构建分发

spafe-0.3.3-py3-none-any.whl (94.0 kB 查看散列值)

上传时间 Python 3

由以下支持