一个命令行工具,用于将语音音频分割成单独的句子,方便语言学习者。
项目描述
语音分割器
描述
语音分割器是一个命令行工具,旨在将语音音频分割成单独的句子。该工具旨在使语言学习者更容易训练听力、发音和单词重音。
[!WARNING] 它使用OpenAI API并需要API密钥才能工作,该密钥未包含在软件包中。根据提供的源的大小,使用费用可能相当昂贵。
动机
该工具是根据一位荷兰教师的请求开发的。她希望有一个工具,可以将提供的源的音频分割成单独的句子,以便学生可以单独听每个句子并跟着重复。
安装
要安装语音分割器,请按照以下步骤操作
pip install 语音分割器
它还需要在您的系统上安装 ffmpeg
。您可以使用以下命令进行安装(适用于Ubuntu):
sudo apt-get install ffmpeg
或(适用于macOS或Windows) brew install ffmpeg
或(适用于Windows) choco install ffmpeg
用法
安装后,您可以直接从命令行使用语音分割工具。基本命令结构如下:
export OPENAI_API_KEY=your_api_key
可选,如果您有组织ID,请设置组织ID:
export OPENAI_ORG_ID=your_org_id
运行命令:
speech-split --help
示例命令
speech-split audio.mp3 ./output
此命令将读取 audio.mp3
,获取转录,将其分割成句子,相应地对齐音频片段,并将结果保存为 output/audio.html
,可在浏览器中查看。
speech-split video.mp4 ./output
此命令将读取 video.mp4
,分割音频,获取转录,将其分割成句子,相应地对齐音频片段,并将结果保存为 output/video.html
,可在浏览器中查看。
speech-split text.txt ./output
此命令将读取 text.txt
,将文本转换为语音,获取转录,将其分割成句子,相应地对齐音频片段,并将结果保存为 output/text.html
,可在浏览器中查看。
演示
您可以在此处看到工具的实际演示。
需求
依赖项将在包安装过程中自动安装。
反馈和贡献
欢迎您的反馈和贡献!如果您遇到任何问题或有改进建议,请随时在GitHub存储库中打开问题或提交带有更改的拉取请求。
许可证
MIT