pyTranscriber是一个开源的免费小工具,对于背景音不明显的视频文件,可以将视频中的对话使用Autosub通过谷歌语音识别API自动翻译转换成字幕文件。
使用
1、运行程序后,选择「Select file」中选中要翻译的单个或者多个视频文件。
2、在「output location」中选择输出文件位置。
3、在「Audio language」中选择音频的语言。然后选择下方的「Transcribe Audio」。
4、完成后会输出两个文件,分别是srt字幕文件及文本文件,其中文本文件为不带时间的纯对话。
需要说明的是pyTranscriber依赖于Google语音识别技术,由于语音识别技术仍不能完全准确,因此结果的准确度可能会有所不同,这取决于许多因素,主要是音频的质量/清晰度。理想情况下,音频中没有其它的背景噪音音乐。
如果只有一个说话者,而他说话的速度又清晰又慢,那么识别的准确性就高得多。有时,在理想/幸运的条件下,可以获得接近95%的准确度结果。
转载需保留链接来源:软件玩家 » pyTranscriber – 视频字幕自动生成