首页 » 技术教程 » 1.怎样做好AI字幕翻译?(字幕)实战翻译的TIPS

1.怎样做好AI字幕翻译?(字幕)实战翻译的TIPS

 

商务合作联系微信:telegram: @tianmeiapp
    站长邮箱:[email protected]  

1.怎么做AI字幕翻译?

• 字幕翻译的特点

• 字幕翻译原则

• 字幕翻译规范

• 实际翻译的提示

2.AI翻译的个人经历

雷锋网人工智能研究俱乐部的分享内容整理如下:

今天跟大家分享一下我自己在AI字幕翻译方面的一些心得和技巧。首先,让我自我介绍一下。我是上海外国语大学英语专业的研究生。和翻译。字幕翻译经验方面,一直从事互联网公开课TED TALK(技术相关话题)的翻译工作,还担任过深度学习纳米学位字幕组翻译评审组长课程,并翻译和审阅了 5,000 多行。课程字幕,目前在雷锋字幕组参与翻译、校对、雨果教学视频等AI相关课程。

本次分享,我将从一个英语专业翻译的角度出发,主要从四个方面来谈谈如何做AI字幕翻译:一是字幕翻译的特点;二、字幕翻译原则;三、字幕翻译规范;第四,实际翻译的TIPS。

字幕翻译的特点是什么?

根据我的翻译经验,我总结了以下三点:

一种是瞬态的,即字幕在视频中出现的时间非常有限,往往一闪而过,对阅读速度有一定要求。这里有一个概念叫CPS-/,在TED上也有要求,即阅读速度不能超过21 cps。简单来说就是CPS不要太高,字幕不要太密太长,观众不要太晚看。

所以在这里给大家推荐一个字幕软件,叫做 ,可以实时显示CPS。你可以看看这张表。第三列,软件会根据字幕的长度和时长计算CPS值。颜色越深,字幕越密,即CPS值越高。如果这个位置显示的颜色太暗,你需要考虑一下,简化你的表达方式。

此外,还有一种方法可以检查字幕是否太长。可以自己模拟观众,翻译后回放视频,站在观众的角度看视频,看能不能跟上字幕。速度。这是我自己经常使用的比较简单的测试方法。

第二种是单向的,因为字幕是作为视频的一部分呈现的,理论上我们不会回去观看。在这一点上,字幕与一般的文字完全不同。文字可以同时看到大片的信息,而字幕则是——这句话结束,显示下一句。因此,在使用句式结构时,尽量不要使用嵌套句式结构,即不要将一个句子分成不在一页的两行字幕,这样观众需要先记住前一句,并且然后结合下一句。只需要一句话就能完全理解,给他们的理解造成负担。

第三种是多线程模式。当每个人在看课程或视频时,他们会边看字幕边听声音。对于大脑来说,它需要同时为不同的任务分配能量。在这种情况下,分配给阅读字幕的能量非常有限。 因此怎么翻译字幕,在翻译时,语言和句型不宜过于复杂。

接下来,我们来说说翻译要遵循的原则。根据以上三个特点,我总结出以下原则:

首先是语言的简洁,即表达要简化,让大家看的时候能跟上字幕的显示速度,句子不要太长。

第二个是易于阅读,这意味着每个人都不一定需要逐字翻译。当我们翻译那些人工智能课程时,让听众理解和学习是最重要的目的。为此,在翻译的时候,首先要自己理解句子,弄清楚它想说什么,然后用听众能理解和理解的方式表达出来。所以,在做课程字幕翻译的时候,最重要的就是传授知识。如果你对它的了解有限,又不能保证听众能理解,你就无法达到这个主要目的。

第三是意义组的完整性,即不要在不恰当的地方断句。对于我们遇到的英文视频,原英文字幕可能是某些软件自动生成的,分词不合适,所以翻译时需要对这些分词进行调整。比如有些英文原版字幕会在形容词和名词之间打断句子,既不符合英文表达习惯,也不符合中文表达习惯。

第四是一致性。在翻译课程的过程中,我们经常会遇到很多专业术语,而且这些术语前后可能会出现很多次,尤其是学生在一个多小时的课程中完成字幕翻译的情况下,这些术语可能由于每个人翻译的不同,会有不一致的地方。因此,在校对的时候,尤其需要注意前后条款的一致性。同时,大家可以在翻译前一起讨论统一术语的表达,以免给听众造成一定的理解负担。

我来说说字幕翻译的规范。其实有些字幕平台本身对字幕翻译也有一些要求。

首先是关于标点符号的使用。比如雷锋字幕组现在做的翻译用的是空格,而不是逗号和句号。我一般用两个半角空格来代替逗号和句号,但是对于一些其他的标点符号,比如逗号、冒号、问号、书名等有实际意义的需要保留,但是逗号和句点是用来断句。标点符号被替换为空格。

二是关于书名、人名、公司名的翻译。一般来说,如果公司名称有常规中文翻译,则直接使用中文翻译。比如在中国叫谷歌;都是它原来的英文名,英文名可以保留。

书籍和论文的标题一般需要翻译成中文。关于书名,你可以先上网查一下这本书有没有中文版。如果是这样,您可以使用现有的中文翻译;如果没有,你可以根据自己的理解翻译。

另外需要特别提及的是人名。我在翻译的时候遇到过一些中文的老师或者助教,他们的名字都是英文的拼音名字。我们通常可以在网上找到他们的中文原名,所以大家在翻译的时候要尽量避免音译。 比如,我曾经翻译过一个叫陈丹琪的名字。她是斯坦福大学的助教。我会在网上搜索一下,找到她原来的中文名字——陈丹琪。

第三是字幕长度的控制。我在这里列出了 TED 的标准,每行总共不超过 42 个字符,仅供参考。我们在翻译的时候,也要看看这个页面的字幕效果,然后自己去掌握。我还在下面附上了一个相关的链接:你可以参考一下。

第四是关于标点符号。我之前也说过不要管组里的标点符号,比如图中第一句,这里把“one bit of”变成了两行,翻译的时候会在第一句提“term”字幕行。第二句的切分也很不自然——PhD和断线,可能是字幕自动生成的问题,所以我翻译的时候直接把“PhD ”的翻译放到下一行字幕里最下面的链接:,有一些分句相关的建议,大家也可以参考一下。

现在我们进入实战部分。先介绍一下翻译中的一些实用技巧和方法,主要有以下四点:

首先,简化复杂性。事实上,中文和英文是两种截然不同的语言。英语是一种“形成”的语言。它通过句法手段和词汇衔接来反映逻辑关系。大多数词只具有逻辑连接功能,其功能大于其内涵。我们经常用的一个比喻是,英语就像一串葡萄,它有一个树干,葡萄串在一起——这些葡萄相当于一串葡萄,靠树干和上面的树枝串起来立起来起来。

汉语是“易合”的语言。它不依靠句法和结构上的明确关系串连起来,而是依靠其内容的内在逻辑,更具形象性和艺术性。例如,“枯藤老树昏鸦小桥流水”这首诗完全是由名词组成的。这样的句型在中文里很漂亮,但在英文里却不可能出现。

所以我们会说中国人感觉就像大珠子和小珠子落在玉盘上。一块玉盘里面有很多珠子,珠子是由彝族组成的,不像葡萄有茎,但是这些彝族之间是有内在联系的,它们是通过内容和实际意义串在一起的。汉语的特点要求我们在翻译的时候要“自满”,不要被英文形式框住,而是要以相称的形式来翻译,否则句子就会带有英文口音。当然,“得意忘形”需要一个长期的积累过程。

另外,由于每行字幕的字数有限,大家在翻译的时候尽量保持简短。针对我的一些翻译经验以及在为别人校对过程中遇到的一些问题,我也整理了一些实用的TIPS给大家。这些案例都是我在翻译或校对的AI课程视频中摘录的句子:

首先,删除不必要的单词“we”、“our”、“your”、“you”,所以它们只是英语中的结构需要。例如,“层”需要在其前面加上the、a、our等修饰符来保证结构的完整性,但这些修饰符没有实际意义。最后两句是一样的。我们可以使用的一种检测方法是,您尝试删除这些词,然后查看您的翻译是否仍然流畅且易于理解。

其次,删除一些,,比如sort of,a bit of stuff,kind of,you know等。比如在某些课程中,有些教授可能会不由自主地使用一些自己的作为框架时的缓冲他们接下来要说什么——中文里也有类似的,比如“then”、“then”。 “那么”和“是”这两个词。图片中有一些案例。您可以看到带有 sort of 和 a bit of 的英文句子非常冗长。翻译时可以删除。

最后一点是简化表达式。比如“made our more”这句话,不用一看到make就翻译成“ba”句,直接用动宾结构即可。换句话来说,前一句“what we're going to do”和后一句“a bit of stuff about”都没有提供信息,所以你不必把它翻过来。总之,在翻译的时候,想想有没有更简洁的表达方式。

其次,明智地使用空格。在字幕中,如果有长句,观众会显得很挣扎,就像我之前说的那样,因为这是一个多线程的操作。看了字幕,如何快速到达信息点?一个很简单的方法就是在适当的地方加空格,把长句变成短句,减轻听者理解的压力,从而提高阅读速度。可以添加空间的地方是可以分成独立组的地方。我们来看一些具体案例:

例如,在“因为”、“所以”、“目前”、“我认为”等词后添加空格,以及“十年前”等表达时间的短语,以便观众快速阅读信息点。

此外,可以将子句拆分为短句/短语。你可以参考我在图中列出的案例。

第三个是句子驱动的。这实际上是同声传译中的一种技术。思路是:我们尽量按照整个句子的意思,按顺序提取句子中的意思组,然后一个接一个地翻译意思组。在这个过程中,我们可能会对原来的句子结构做一些调整或者添加一些连词或者转换句子。先说一个我们同声传译员过去讲的例子。例如,仍然有 5 / 我们称之为一天。如果我们使用正常的翻译方法,我们会将其翻译为“在我们结束今天的会议之前,我们将有五分钟”;但是如果用句驱动的话,可以翻译成“还有五分钟,我们分手”,这样句子就被理顺了。第二句同理。这种翻译方式可以给你更多的选择和思路。

在句子驱动中,第一个特定的技巧是重复。当一行字幕信息不完整时,可以补全这一行的关键词,使每一行的字幕显得完整,同时可以在不打乱句子结构的情况下顺应英文意思。翻译。比如第一种情况,“内容”出现在每一行内容中,加上这些“内容”,让每一行字幕看起来完整。第二个例子也是一样。

第二种具体技术是词性转换。汉语的一大特点是动词的使用较多。基于此,我们可以将英语中的名词或介词转为动词。比如第一句本来是名词,但可以翻译成“win”,这样可以让句子更流畅,更符合中国人的表达习惯。

第三种是被动转主动。因为汉语中有很多主动句型,如果翻译中的被动句型过多,就会给人一种强烈的翻译语气。

此外,我们还可以对句子做一些其他的修改。比如下面这句话的翻译,结合上下文,我不会直接翻译,而是用“准确”来表达整句词的意思。

最后,我想补充一些我自己的亲身经历。

首先是边翻边学。如果你在翻译一门课程,同时也在学习这门课程,遇到不懂的地方,你会先上网查一些同主题的中文资料,这样你就可以理解知识点,然后用听众来理解。用中文表达——这样不仅可以让翻译更好,也可以促进自己的学习。

二、遇到看不懂的术语怎么办?

首先,我们可以在网上搜索这些术语,但是在搜索的过程中,要注意这些来源是否可靠。比如我在百度上搜索的时候,会特别注意出处——我个人比较喜欢CSDN博客和知乎出处的文章。另外,我也推荐吴恩达老师的公众号“吴恩达”,因为他在教一门Deep课程,已经翻译成中文资料,会推送到他的公众号上。我认为这些材料中的通用术语的中文翻译是权威的。

第二种方法是使用雷锋字幕组的云词库。在翻译过程中,如果遇到不理解的术语,可以参考云词库中的中文翻译。

如果以上方法都不行,可以和群里的小伙伴一起讨论,一起寻找更合适的翻译方法。

这里我要特别指出一点,AI领域还处于高速发展阶段,很多中文表达方式还没有固定下来。人们通常在互联网上搜索一个术语时,会看到来自不同来源的不同翻译。这种情况下怎么翻译字幕,更好的办法其实是讨论哪个翻译更适合中文。它可以更好地反映它想用英语表达的意思。不要以为网上出现的翻译是最好的。如果我们能讨论一个更合适的翻译方法,让它更广泛地被使用和成为主流,那就更有意义了。

第三,如果有术语需要解释怎么办?

第一种情况是有些术语有缩写,缩写。遇到这种术语,可以采取的方法是:第一次出现时,先翻译成中文,括号里写上它的英文缩写。当概念再次出现时,字数有限。 , 可以使用缩写。比如这句话第一次出现的时候,我先翻译“ ”,后面括号里写NLP。后面出现这个词时,可以直接使用NLP。这实际上可以帮助观众积累一些英语专业术语的知识。也就是说,当他们以后在浏览信息时看到这些术语的英文缩写时,他们就会知道该缩写是指什么。

第二种情况,你可能会觉得英文部分解释的不是很清楚,或者你看了之后觉得观众理解不好,需要补充一些解释。这时候可以用一些简洁的话来解释一下。如果因为解释太长,可以考虑将下面的文字移到下一行进行微调。毕竟,字幕翻译的最终目的是为了让观众理解。比如我在翻译积木的时候,想到很多观众可能看不懂,所以我不仅翻译了“模块”,还标注了我对“注:即有上下”一词的理解1x1 卷积层”。

第三种情况,不知道英文怎么说怎么办?

在这种情况下,一半的概率是英文字幕本身是错误的,比如in , conv net as com net, pair as pear。怎么做?您可以聆听原声英语。例如,第一句话中有一个。我们无法理解。我们可以听听视频的原声,会更容易发现应该是conv net这个词。另一种方法是(对于某些课程),当你回去听英文原句的时候,也可以查看对应的PPT——因为有时候教授在读这句话的时候,课程中的PPT也会同步显示。这个句子。例如,我遇到了一个字幕。句子中的if造成了翻译困难,但是当我查看PPT时发现没有if。删掉if后,句子就容易理解了。

如果以上方法都不起作用,不妨向你的朋友寻求帮助。

商务合作联系微信:telegram: @tianmeiapp
    站长邮箱:[email protected]  

原文链接:1.怎样做好AI字幕翻译?(字幕)实战翻译的TIPS,转载请注明来源!

0