|
本帖最后由 yaojingzhe 于 21-4-29 17:10 编辑
菜鸟教菜鸟之
语音转字幕之基于python3开源代码autosub3详细教程
有时我们很容易找到国语音轨,但找不到对应的国语字幕,如果听一句打一句字的录入,太费劲了,这里给大家分享国语音轨直接转srt字幕的方法
语音转字幕及处理字幕和音轨要用到的软件,请看我发布的这几个贴子:
SubtitleEdit 3.6 把SUP转SRT 及百度翻译插件等实用插件
https://cnlang.org/thread-84159-1-1.html
Aegisub安装Aegisub-motion v1.0.9等84个自动化脚本教程
https://cnlang.org/thread-84318-1-1.html
听录和转字幕用到的人声分离工具之一Spleeter详细教程
https://cnlang.org/thread-84080-1-1.html
语音转字幕之用vidio-srt调用阿里云免费语音识别详细教程
https://cnlang.org/thread-84580-1-1.html
语音转字幕之用autosub-alpha调用百度云免费语音识别详细教程
https://cnlang.org/thread-84853-1-1.html
基础篇:安装和配置python、ffmpeg、微软常用运行库集合
请看我的教程
《听录_语音转字幕_重混国语音轨,纯人声分离工具之一SpleeterGUI详细教程》
准备篇:提取纯人声音轨
请用SpleeterGUI把国语音轨的纯人声提取出来,
分离音轨的方法请看我上面的贴子
这一步不是必须的,但能提高语音转文字的识别率,并且时间轴也在语音附件,否则,时间轴有些会在语音前后5秒远的地方,增加校对文字和调时间轴的工作量。
重要说明:由于语音识别技术仍不能完全准确,因此结果的准确度可能会有所不同,这取决于许多因素,主要是音频的质量/清晰度。理想情况下,音频输入不应有背景噪音、声音效果或音乐。如果只有一个说话者,而他说话的速度又清晰又慢,那么识别的准确性就高得多。有时,在理想/幸运的条件下,有可能获得接近95%的准确度结果。
完美星球的腾讯国语转字幕效果:

正文:
另外,我正在与deepspeech的团队联系,用deepspeech的数据库实现离线的语音转字幕,双方已经沟通了多次。我现在只实现了英语转英文字幕。用他们的普通话库,一直没有成功。
感谢大家的支持!我将把我更多的经验与大家分享。
国语视界真的是我最喜欢的论坛 |
评分
-
查看全部评分
|