第四代AI翻译是倒退吗?

如果将 Google Translate(NMT)视为第三代,那么以大规模语言模型(LLM)为基础的 AI 翻译可以称为第四代。
第四代的特点是,相较于第三代,可以更容易地学习“术语”和“短语”翻译方式的(某种)规则。
在这方面,第四代机器翻译与第一代(基于规则)的机器翻译非常相似。
第三代也有术语表等功能,比如 Google Translate 支持 AutoML 等迁移学习方法,可以根据企业需求进行个性化调整,但这些方法的副作用往往太强,常常导致翻译质量下降。术语表功能只能用于名词,迁移学习(AutoML)的方法也太复杂了。而且,很难说它有明显效果。
在第四代中,只需将术语和短语的翻译规则录入系统。由于基于大型语言模型,规则可以像对人类下指令一样进行设定。
例如,希望将“产品”翻译为“product”。我们会把这个词条添加到词典中,但在第三代系统中,翻译词“product”只是作为字符串固定下来,既不会变成复数形式,也不会在作为标题时自动大写为“Product”。在第四代中,系统会自动处理所需的词形变化。
第四代技术使译者能够在个人层面训练和提升AI翻译。在第一代基于规则的机器翻译中,个人翻译者需要购买机器翻译软件,自己一点点地添加词典条目,慢慢改进机器翻译的结果(但这是一项费力却收获甚少的无用功)。第四代同样可以做到。
在第四代中,您可以添加术语表,也可以导入以往的翻译记忆库(TM)。还可以登记短语级别的翻译方法。而且,基础翻译质量本身非常好。能够无副作用地提升机器翻译的水平。
机器翻译和人工智能翻译的更新换代大约每十年发生一次。十年后,或许会迎来第五代技术,但我们完全无法想象它会是什么样子。
然而,未来十年无疑将以第四代人工智能翻译为核心。
