Python对常用openSMILE功能集的封装
项目描述
Python接口用于提取 openSMILE 功能。
$ pip install opensmile
功能集
目前支持三个标准集。 ComParE 2016 是最大的,具有超过6k个特征。较小的集 GeMAPS 和 eGeMAPS 有 v01a、v01b 和 v02(只有 eGeMAPS)。除非需要与原始论文的向后兼容性,否则我们建议使用最新版本。
每个功能集可以在两个级别上进行提取
低级描述符(LDD)
函数
对于 ComParE 2016 有第三个级别
LLD差分
以下表格列出了每个集合和级别的特征数量。
从v2.0.0版本开始
名称 |
特征数量 |
---|---|
ComParE_2016 |
65 / 65 / 6373 |
GeMAPSv01a |
18 / - / 62 |
GeMAPSv01b |
18 / - / 62 |
eGeMAPSv01a |
23 / - / 88 |
eGeMAPSv01b |
23 / - / 88 |
eGeMAPSv02 |
25 / - / 88 |
在v2.0.0之前
名称 |
特征数量 |
---|---|
ComParE_2016 |
65 / 65 / 6373 |
GeMAPSv01a |
5 / 13 / 62 |
GeMAPSv01b |
5 / 13 / 62 |
eGeMAPSv01a |
10 / 13 / 88 |
eGeMAPSv01b |
10 / 13 / 88 |
代码示例
代码示例,从音频文件中提取ComParE 2016功能
import opensmile
smile = opensmile.Smile(
feature_set=opensmile.FeatureSet.ComParE_2016,
feature_level=opensmile.FeatureLevel.Functionals,
)
y = smile.process_file('audio.wav')
许可证
openSMILE采用双重许可模式。由于本项目的主要目标是广泛使用软件以促进音频-视觉信号领域机器学习研究,因此源代码和二进制文件可以在开源许可下免费用于私人、研究和教育用途(见LICENSE)。不允许使用openSMILE的开源版本用于任何商业产品。公司的基础研究,例如,是允许的,但如果产品是研究的结果,我们要求您购买商业开发许可证。有关更多信息,请联系我们info@audeering.com(或访问我们的网站https://www.audeering.com)。
原始作者:Florian Eyben,Felix Weninger,Martin Wöllmer,Björn Schuller
版权所有 © 2008-2013,慕尼黑工业大学人机通信研究所,德国
版权所有 © 2013-2015,audEERING UG (haftungsbeschränkt)
版权所有 © 2016-2020,audEERING GmbH
引用
请在您的出版物中引用以下论文来引用openSMILE
Florian Eyben,Martin Wöllmer,Björn Schuller:“openSMILE - 慕尼黑多功能和快速开源音频特征提取器”,ACM多媒体(MM)论文集,ACM,意大利佛罗伦萨,ISBN 978-1-60558-933-6,第1459-1462页,2010年10月25日至29日。
项目详情
下载文件
下载适合您平台文件的文件。如果您不确定要选择哪个,请了解更多关于安装包的信息。
源代码发行版
构建发行版
哈希值 for opensmile-2.5.0-py3-none-manylinux_2_17_x86_64.whl
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 99d9f793d213e7abbec56ab4d84906d8c61f91544d1cd2c53a9eec85cc52329f |
|
MD5 | 3f84fa933986a78c10660f356ebbadfd |
|
BLAKE2b-256 | 847dd265df3c8096bd482ae519233960087a758107e454438d3a0fcf1aaab8ff |
哈希值 for opensmile-2.5.0-py3-none-manylinux_2_17_armv7l.whl
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 9849551057409e12ae15041c7de7d8e6c7ffca19c2be78c8cc65bd2ef845f287 |
|
MD5 | f6f7922daf80e1ba5d0a948dcfb1d255 |
|
BLAKE2b-256 | 547a49188bf9bed1ba147995a7d3e1c927e3f8a1c336af7eea3306db21382276 |
哈希值 for opensmile-2.5.0-py3-none-manylinux_2_17_aarch64.whl
算法 | 哈希摘要 | |
---|---|---|
SHA256 | adf0e5378071b2adb7b34dd8e61f0faafca1d0fc991659a4141935cc0002bddf |
|
MD5 | f209b8ace984664aefbc36015d8b3732 |
|
BLAKE2b-256 | ae2e08c91f1abcd3f2c63807a6e054790d5931d63262ef75fef8f1df5ad5b503 |
哈希值 for opensmile-2.5.0-py3-none-macosx_11_0_arm64.whl
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 36be99bedc9bc28efae6b7ed2694bd67e028c0cccf72d1cee2c78143b7ba8923 |
|
MD5 | 0f6c8ec22b227ab2a1ff8d6ee9c7451f |
|
BLAKE2b-256 | 81cb9536adac8da696b64d9f3209f23cf2c4eee27a4f7522110cb37b8e7c105f |
哈希值 for opensmile-2.5.0-py3-none-macosx_10_4_x86_64.whl
算法 | 哈希摘要 | |
---|---|---|
SHA256 | 9f2db8f99eae4a4cd1300679e6be348dd7c594a131a68925bbc129b590e8abc6 |
|
MD5 | 3affbd2efa4c0290c968201ea801ed11 |
|
BLAKE2b-256 | 4d9290d81b5769a5e9eb81c014a454d53f125feada91ca2a1ce053006b92da7e |