跳转到主要内容

Python对常用openSMILE功能集的封装

项目描述

Test status code coverage opensmile's documentation opensmile's supported Python versions opensmile's audEERING license

Python接口用于提取 openSMILE 功能。

$ pip install opensmile

功能集

目前支持三个标准集。 ComParE 2016 是最大的,具有超过6k个特征。较小的集 GeMAPSeGeMAPSv01av01bv02(只有 eGeMAPS)。除非需要与原始论文的向后兼容性,否则我们建议使用最新版本。

每个功能集可以在两个级别上进行提取

  • 低级描述符(LDD)

  • 函数

对于 ComParE 2016 有第三个级别

  • LLD差分

以下表格列出了每个集合和级别的特征数量。

从v2.0.0版本开始

名称

特征数量

ComParE_2016

65 / 65 / 6373

GeMAPSv01a

18 / - / 62

GeMAPSv01b

18 / - / 62

eGeMAPSv01a

23 / - / 88

eGeMAPSv01b

23 / - / 88

eGeMAPSv02

25 / - / 88

在v2.0.0之前

名称

特征数量

ComParE_2016

65 / 65 / 6373

GeMAPSv01a

5 / 13 / 62

GeMAPSv01b

5 / 13 / 62

eGeMAPSv01a

10 / 13 / 88

eGeMAPSv01b

10 / 13 / 88

代码示例

代码示例,从音频文件中提取ComParE 2016功能

import opensmile

smile = opensmile.Smile(
    feature_set=opensmile.FeatureSet.ComParE_2016,
    feature_level=opensmile.FeatureLevel.Functionals,
)
y = smile.process_file('audio.wav')

许可证

openSMILE采用双重许可模式。由于本项目的主要目标是广泛使用软件以促进音频-视觉信号领域机器学习研究,因此源代码和二进制文件可以在开源许可下免费用于私人、研究和教育用途(见LICENSE)。不允许使用openSMILE的开源版本用于任何商业产品。公司的基础研究,例如,是允许的,但如果产品是研究的结果,我们要求您购买商业开发许可证。有关更多信息,请联系我们info@audeering.com(或访问我们的网站https://www.audeering.com)。

原始作者:Florian Eyben,Felix Weninger,Martin Wöllmer,Björn Schuller

版权所有 © 2008-2013,慕尼黑工业大学人机通信研究所,德国

版权所有 © 2013-2015,audEERING UG (haftungsbeschränkt)

版权所有 © 2016-2020,audEERING GmbH

引用

请在您的出版物中引用以下论文来引用openSMILE

Florian Eyben,Martin Wöllmer,Björn Schuller:“openSMILE - 慕尼黑多功能和快速开源音频特征提取器”,ACM多媒体(MM)论文集,ACM,意大利佛罗伦萨,ISBN 978-1-60558-933-6,第1459-1462页,2010年10月25日至29日。

项目详情


下载文件

下载适合您平台文件的文件。如果您不确定要选择哪个,请了解更多关于安装包的信息。

源代码发行版

opensmile-2.5.0.tar.gz (9.3 MB 查看哈希值

上传时间 源代码

构建发行版

opensmile-2.5.0-py3-none-win_amd64.whl (793.6 kB 查看哈希值

上传时间 Python 3 Windows x86-64

opensmile-2.5.0-py3-none-manylinux_2_17_x86_64.whl (996.2 kB 查看哈希值

上传时间 Python 3 manylinux: glibc 2.17+ x86-64

opensmile-2.5.0-py3-none-manylinux_2_17_armv7l.whl (823.5 kB 查看哈希值

上传于 Python 3 manylinux: glibc 2.17+ ARMv7l

opensmile-2.5.0-py3-none-manylinux_2_17_aarch64.whl (890.1 kB 查看哈希值)

上传于 Python 3 manylinux: glibc 2.17+ ARM64

opensmile-2.5.0-py3-none-macosx_11_0_arm64.whl (706.2 kB 查看哈希值)

上传于 Python 3 macOS 11.0+ ARM64

opensmile-2.5.0-py3-none-macosx_10_4_x86_64.whl (774.6 kB 查看哈希值)

上传于 Python 3 macOS 10.4+ x86-64

由以下机构支持

AWS AWS 云计算和安全赞助商 Datadog Datadog 监控 Fastly Fastly CDN Google Google 下载分析 Microsoft Microsoft PSF 赞助商 Pingdom Pingdom 监控 Sentry Sentry 错误记录 StatusPage StatusPage 状态页面