国语视界

 找回密码
 立即注册
查看: 286|回复: 9

[字幕技术] SubtitleEdit + PaddleOCR引擎 OCR图形字幕简易说明

[复制链接]

5

主题

933

帖子

220

积分

排长

大洋
13617
阅读权限
30
发表于 25-9-9 23:01 | 显示全部楼层 |阅读模式
本帖最后由 Chongzi 于 25-9-9 23:07 编辑

       前段时间简单学习试用了一下PaddleOCR引擎,觉得还不错,相比老牌软件IdxSubOcr效果更好,它支持80+语言,对常见中英字幕的识别友好,弱点是对标点或特殊符号的识别还有待提高,但这是基于默认配置和简易模型的体验,并未深究,一点浅见。相对免费使用的软件,还是可以的。刚好前两天有坛友分享相关的技能,在这里也分享下此方案,其实也挺简单的。本人也是初学,有不对的地方还请大佬们指正,友好交流。

本文使用的主角软件,都是Github上的开源项目:

Subtitle Edit 4.0.13 (4.0.11开始支持PaddleOCR,简称SE)
PaddleOCR 独立版 1.3.2

本文基于默认配置和简易模型,在Windows下以SUP字幕为例,其他格式类同。
为方便初学者从头说起,涉及软件文末有网盘分享。


正片开始


1.0 软件安装

1.1 Subtitle Edit 的安装

下载 Subtitle Edit 的安装包,按需选择,本文以便携版为例,安装过程略...这个不用说了吧。
Github地址:
https://github.com/SubtitleEdit/subtitleedit/releases

方便有访问Github困难的朋友,先丢个加速软件,Dev-Sidecar(开发者边车)加速访问码农们常用的网站。
Github地址:https://github.com/docmirror/dev-sidecar/releases

1.2 PaddleOCR 的安装

现已更新为独立版,不再需要装Python。

1.2.1 自动安装方式

前置条件:网络好,能顺畅下载Github上的文件,或备魔法。
先准备一条SUP字幕文件。
打开SE,选择 文件 - 导入 - 导入蓝光字幕以OCR...,导入准备的SUP文件。



然后选择OCR方式:Paddle OCR,再根据下图操作。这里分CPU和GPU两个版本,使用GPU版的话需要是N卡且支持CUDA。



下载进度跑完后,不出意外的话就是安装好了,可以开始OCR验证一下。

1.2.2 手动安装方式

对于自动安装困难的朋友,可以选择此方式。
首先在此下载主文件和支持文件两个压缩包,根据你的硬件按需选择。
Github地址:https://github.com/timminator/PaddleOCR-Standalone/releases   
加速下载

本文以GPU版为例,下载主文件 PaddleOCR-GPU-v1.3.2-CUDA-11.8.7z 和支持文件 PaddleOCR.PP-OCRv5.support.files.VideOCR.7z



下载好后,进入安装SE的根目录,新建一个名为 PaddleOCR3-1 的文件夹,



然后把下载好的两个压缩包内的文件全部解压或复制到 PaddleOCR3-1 文件夹内,注意最终的目录结构,主文件和支持文件需在同一级下。





至此,手动安装完成。CPU版一样的方法,只是下载解压的主文件不同。

2.0 使用方法

2.1 首先打开SE,导入需要OCR的SUP字幕文件(参考前面步骤1.2.1),选择OCR方式 Paddle OCR,然后选择字幕语言,这里以简英双语字幕为例。



2.2 选好语言后,勾选使用GPU工作,不勾选就是使用CPU工作,如果安装的是CPU版即使勾选使用GPU实际也是使用的CPU工作。
      然后选择OCR的起始字幕编号,再点击 开始OCR,等待处理结果。首次使用可能初始化的时间较久,请耐心等待。





2.3 OCR完成后,可以在编辑框里校对修改识别错误的字词,然后确定载入SE。



2.4 至此,OCR SUP字幕就完成了,之后就是常规操作了。处理好后,就可以保存为你需要的字幕格式食用。





如果有其他更好的免费方案,可以指出,大家一起交流学习。

最后附上本文中所使用到的软件的网盘地址(百度和天翼)





本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x

点评

速度跟se自带的ocr相比如何?  发表于 25-9-10 03:03

评分

参与人数 2威望 +20 大洋 +505 收起 理由
其实我很乖 + 20 + 500 赞一个!
q3f76jidc6 + 5 赞一个!

查看全部评分

196

主题

8677

帖子

4036

积分

团长

大洋
19992
阅读权限
60
发表于 25-9-10 00:05 | 显示全部楼层
本帖最后由 hexiong26032 于 25-9-10 00:13 编辑

非常感谢学习了,看来还得给坛友们普及一点油猴知识,不然有的坛友下载还真是个问题
回复 支持 反对

使用道具 举报

37

主题

1316

帖子

1257

积分

营长

大洋
7834
阅读权限
50
发表于 25-9-10 00:28 | 显示全部楼层
技术大伽呀!教程浅显易懂。
回复 支持 反对

使用道具 举报

66

主题

4637

帖子

3571

积分

团长

大洋
102980
阅读权限
60

热心会员

QQ
发表于 25-9-10 00:32 | 显示全部楼层
非常感谢分享好文,学习学习!!!
回复 支持 反对

使用道具 举报

5

主题

933

帖子

220

积分

排长

大洋
13617
阅读权限
30
 楼主| 发表于 25-9-10 16:34 | 显示全部楼层
速度点话,用文中字幕测试了一下,共809条字幕,我的老机子,PaddlOCR GPU用时25秒的样子,CPU用时3分11秒左右,SE自带用Tesseract5.5用时27分23秒左右,而且错误一大堆,不在一个级别...@i990049
回复 支持 反对

使用道具 举报

30

主题

575

帖子

165

积分

班长

大洋
2345
阅读权限
20
发表于 25-9-10 19:10 | 显示全部楼层
Chongzi 发表于 25-9-10 16:34
速度点话,用文中字幕测试了一下,共809条字幕,我的老机子,PaddlOCR GPU用时25秒的样子,CPU用时3分11秒 ...

在线识别的更快,直接上传sup文件,不到半分钟就出来了
回复 支持 反对

使用道具 举报

39

主题

2233

帖子

1337

积分

营长

大洋
38517
阅读权限
50
发表于 25-9-10 20:30 | 显示全部楼层
又有一个OCR的方法,感谢楼主分享
回复 支持 反对

使用道具 举报

0

主题

2628

帖子

1256

积分

营长

大洋
994
阅读权限
50
发表于 25-9-10 20:43 | 显示全部楼层
学习学习,感谢分享。
回复 支持 反对

使用道具 举报

280

主题

4971

帖子

6万

积分

炊事员

大洋
414824
阅读权限
120

灌水之王热心会员论坛元老王者至尊

发表于 25-9-11 18:01 | 显示全部楼层
不错,也可以用这个百度飞浆提取视频硬字幕
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表