一个用于基准测试AI/ML应用的库。
项目描述
关于
这是一个用于基准测试自动语音识别引擎的命令行工具。
它设计用于非学术生产环境,优先考虑易用性和相对基准测试,而不是科学程序和高精度绝对评分。
由于语言、算法和音频特性的广泛性,没有单个STT引擎可以在所有情况下都表现出色。因此,这个工具将责任放在用户身上,让他们设计自己的基准测试程序,并根据测试数据和指标的组合来决定哪个引擎最适合他们的特定用例。
使用示例
返回假设转写与参考之间的单词插入、删除、替换和匹配数
benchmarkstt --reference reference.txt --hypothesis hypothesis.txt --diffcounts
返回将参考和假设都转换为小写后的单词错误率。这种规范提高了单词错误率的准确性,因为它消除了可能被视为错误的差异
benchmarkstt -r reference.txt -h hypothesis.txt --wer --lowercase
在应用配置文件中指定的所有规范化规则后返回视觉差异
benchmarkstt -r reference.txt -h hypothesis.txt --worddiffs --config conf
更多信息
这是一个旨在创建用于基准测试AI/ML应用的库的合作项目。它是在响应广播公司和媒体组织访问服务提供商的需求时创建的,但任何人都可以贡献力量。该项目背后的团队是EBU的媒体信息管理与AI团队。
目前该团队专注于语音转文本,但它将考虑为其他AI/ML服务创建基准测试工具。
有关此项目的详细信息,包括动机和指导原则,请参阅项目的wiki。
要安装并开始使用此工具,请访问文档。
项目详情
下载文件
下载适用于您平台的文件。如果您不确定选择哪个,请了解有关安装包的更多信息。
源代码分布
benchmarkstt-1.1.tar.gz (36.5 kB 查看哈希值)
构建分布
benchmarkstt-1.1-py3-none-any.whl (51.4 kB 查看哈希值)
关闭
benchmarkstt-1.1.tar.gz 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | d55cf005b1fac94279a466bff2145b8e5c7f6097160e383c1da46582482260fc |
|
MD5 | cd532a49100489a9589a17ae24ffd401 |
|
BLAKE2b-256 | d1413cbea4465eb19cb82363f70350757b6c28b90941244c8a9bf1db2bc9e267 |
关闭
benchmarkstt-1.1-py3-none-any.whl 的哈希值
算法 | 哈希摘要 | |
---|---|---|
SHA256 | b1ee62cc16ac593b542cfe16d0f35ce3bff26ada80b25b6f92576e68a906877a |
|
MD5 | 69aa4b9cca2408dc59cf6440876b3d92 |
|
BLAKE2b-256 | 04e9d1e8fcde4e3a3eb656d409595eff52d0b461c7f1246a968a07b293f660cd |