跳转到主要内容

一个命令行工具,用于将语音音频分割成单独的句子,方便语言学习者。

项目描述

语音分割器

Test PyPI Version PyPI - Python Version Coverage Code style: black

描述

语音分割器是一个命令行工具,旨在将语音音频分割成单独的句子。该工具旨在使语言学习者更容易训练听力、发音和单词重音。

[!WARNING] 它使用OpenAI API并需要API密钥才能工作,该密钥未包含在软件包中。根据提供的源的大小,使用费用可能相当昂贵。

动机

该工具是根据一位荷兰教师的请求开发的。她希望有一个工具,可以将提供的源的音频分割成单独的句子,以便学生可以单独听每个句子并跟着重复。

安装

要安装语音分割器,请按照以下步骤操作

pip install 语音分割器

它还需要在您的系统上安装 ffmpeg。您可以使用以下命令进行安装(适用于Ubuntu):

sudo apt-get install ffmpeg 或(适用于macOS或Windows) brew install ffmpeg 或(适用于Windows) choco install ffmpeg

用法

安装后,您可以直接从命令行使用语音分割工具。基本命令结构如下:

export OPENAI_API_KEY=your_api_key

可选,如果您有组织ID,请设置组织ID:

export OPENAI_ORG_ID=your_org_id

运行命令:

speech-split --help

示例命令

speech-split audio.mp3 ./output

此命令将读取 audio.mp3,获取转录,将其分割成句子,相应地对齐音频片段,并将结果保存为 output/audio.html,可在浏览器中查看。

speech-split video.mp4 ./output

此命令将读取 video.mp4,分割音频,获取转录,将其分割成句子,相应地对齐音频片段,并将结果保存为 output/video.html,可在浏览器中查看。

speech-split text.txt ./output

此命令将读取 text.txt,将文本转换为语音,获取转录,将其分割成句子,相应地对齐音频片段,并将结果保存为 output/text.html,可在浏览器中查看。

演示

您可以在此处看到工具的实际演示。

需求

依赖项将在包安装过程中自动安装。

反馈和贡献

欢迎您的反馈和贡献!如果您遇到任何问题或有改进建议,请随时在GitHub存储库中打开问题或提交带有更改的拉取请求。

许可证

MIT

项目详情


下载文件

下载适合您平台的文件。如果您不确定选择哪个,请了解有关安装包的更多信息。

源分布

speech_splitter-0.0.4.tar.gz (8.7 kB 查看散列

上传时间

构建分布

speech_splitter-0.0.4-py3-none-any.whl (7.6 kB 查看散列

上传时间 Python 3

由以下组织支持

AWS AWS 云计算和安全赞助商 Datadog Datadog 监控 Fastly Fastly CDN Google Google 下载分析 Microsoft Microsoft PSF 赞助商 Pingdom Pingdom 监控 Sentry Sentry 错误记录 StatusPage StatusPage 状态页面