博客布局

第4代AI翻译是在回归祖先吗?

柳英夫 • 2024年01月05日

谷歌翻译(NMT)如果被称为第三代,那么以大型语言模型(LLM)为基础的AI翻译可以被称为第四代。


第 4 代的特点是,相比第 3 代,可以更容易地学习“术语”和“短语”的翻译规则。


在这一点上,第四代机器翻译与第一代(基于规则)非常相似。


第3代也,有词汇表功能,Google Translate也有AutoML等迁移学习方法,可以调整为自己喜欢的方式,但是副作用太强,经常导致翻译质量下降。词汇表功能只能用于名词,迁移学习(AutoML)方法也太复杂。而且,很难说效果好。


第4代中,只需将术语和短语翻译规则注册到系统中,因为它是基于大型语言模型,所以可以以与人类发出指令时相同的形式来规定规则。


例如,假设我们想要将“製品”翻译为“product”。我们需要将其添加到词典中,但是在第三代中,“product”作为一个字符串被固定下来,无法进行复数形式的活用,也不会在标题中被大写。而在第四代中,可以自动处理所需的活用形式。


第 4 代已经可以在个人翻译者的水平上培养 AI 翻译。在第 1 代基于规则的机器翻译中,个人翻译者购买机器翻译软件,然后辛苦地注册词典,培养机器翻译的结果(虽然这是一项劳累而收获少的徒劳努力)。在第 4 代也可以做同样的事情。


第4代中,可以注册术语表,也可以注册过去的翻译资产,即翻译记忆(TM)。还可以注册短语级别的翻译方式。此外,基础翻译质量本身也相当不错。可以无副作用地促进机器翻译的发展。


机器翻译·AI翻译的世代交替大约每10年发生一次。10年后将会出现第5代,但是完全无法想象它会是什么样子。


但是,未来的十年无疑将以第四代AI翻译为中心。




田中多賀雄 2024年4月17日
将自治体相关术语汇集为多种语言,并作为“自治体语言资产数据库”公开。任何人都可以自由浏览。
田中多賀雄 2024年3月11日
网站自动多语化解决方案Cistate Translation Proxy已被引入国际无开挖技术协会(The International Society for Trenchless Technology,以下简称ISTT)的网站。该协会网站的内容已被翻译成日语、西班牙语、德语和葡萄牙语,并传达给各国技术人员。
田中多賀雄 2024年1月31日
网站自动多语言化解决方案Cistate Translation Proxy 将免费提供给『令和6年能登半岛地震支援信息导航』。支持多语言发布援助信息。
柳英夫 2023年12月21日
2023年10月1日,我们的运营办公室已从恵比寿花园广场搬迁至Ichigo Ebisu Green Glass 6楼。
柳英夫 2023年12月21日
株式会社Cistate Solutions的网站已经更新。主题是“超凡的AI翻译”和“第4代的AI翻译”。
田中多賀雄 2023年12月04日
经济产业省关东经济产业局为了强力推进地区服务业者劳动生产率的提高和竞争力的增强,成立了广域关东地区的支持网络SISC Kanto(关东地区服务业支持联盟),Cistate Translation Proxy已被注册到SISC Kanto作为支持多语言内容运营的解决方案。
田中多賀雄 2023年7月7日
J联赛的FC东京(东京足球股份有限公司)已经引入了我们的多语言化解决方案“Cistate Translation Proxy”,并发布了英文版网站。通过英文版网站,我们将实现对海外旅客和国内外国人的实时、高效的信息传播。 FC东京: https://www.fctokyo.co.jp/en/
柳英夫 2023年4月19日
东京都稻城市(市长:高桥胜浩)为了加强向居住在该市的外国人发布信息,从2023年4月1日起,引入株式会社Cistate Solutions(总部位于东京都涩谷区惠比寿,代表人:柳英夫)提供的网页自动多语言化解决方案『Cistate Translation Proxy(Cistate翻译代理)』到市官方网站,加强多语言信息发布。
更多帖子
分享至: