|
最省事的方法是把字幕全部转换成utf8编码,并且字幕全部使用gb18030 ttf字体,不要用谷歌思源那种民间改造出来的ttf字体,谷歌官方是没有ttf字体的,因为做出来的单条双字字幕行间距很大,也不要用gbk字体,上面这些字体跟utf8的字体编码不是100%对应的,只有gb18030字体才是100%对应的,现在的跨平台字幕软件为了兼容手机机顶盒外挂字幕都是使用utf8-bom编码,比较老旧的手机或者机顶盒识别不了utf8-bom,只能识别utf8-withoutBOM。另外有些国产播放器是不支持utf8字幕的,比如迅雷看看和暴风影音,直接显示乱码,potplayer和恒星播放器支持utf8字幕,为了照顾这些播放器,人人影视的字幕全部用utf16编码。批量把非utf8字幕转换成utf8的方法如下。
字幕软件里面的unicode指的是utf16,不论中文还是英文都占用两个字节。
首先,我们要明白,GB2312、GBK和UTF-8都是一种字符编码,除此之外,还有好多字符编码。只是对于我们中国人的网站来说,用这三种编码 比较多。简单的说一下,为什么要用编码,在计算机内,储存文本信息用ASC II码,每一个字符对应着唯一的ASCII码。最初计算机是由美国发明的,他们也用的是键盘和上面的字母,所以他们的字符ASCII好解决。但是我们中国 的就不同了,每个汉字要对应唯一的ASCII码。这样,就出来了国家制定的字符编码标准:GB2312、GBK等。其他国家,其他语言也有他们对应的编码 标准。 GB 就是国标的意思,GB2312和GBK主要用于汉字的编码,而UTF-8是全世界通用的。意思就是说,如果你的网页主要面对使用汉语的中国人的话,使用 GB2312和GBK非常好,文字储存体积要小,有一些优点。如果你的网页要面向世界的话,你再用GB2312和GBK作为网页编码的话,有些电脑上的浏 览器没有这种编码,你的网页汉字内容就会变成无法识别的乱码。 它们通常用在网页的meta标签内,例如:,表示这个页面使用的是GB2312编码。这个信息是给浏览器看的,浏览器会优先考虑使用从网页头部提取出来的编码信息对网页进行解码。当然, 我们也可以强制浏览器使用某种编码解释网页,这样我们就看到了传说中的乱码。
GBK、GB2312等与UTF8之间都必须通过Unicode编码才能相互转换:
GBK、GB2312--Unicode--UTF8
UTF8--Unicode--GBK、GB2312
对于一个网站、论坛来说,如果英文字符较多,则建议使用UTF-8节省空间。不过现在很多论坛的插件一般只支持GBK。
如果是中文的网站 推荐GB2312 GBK有时还是有点问题 为了避免所有乱码问题,应该采用UTF-8,将来要支持国际化也非常方便 UTF-8可以看作是大字符集,它包含了大部分文字的编码。
|
|