机器翻译的未来:AMTA 2023 关于生成式 AI 与大语言模型的洞察

驾驭机器翻译变革的浪潮 

AMTA 是机器翻译(MT)从业人员和爱好者的灯塔。AMTA 2023 活动于 2023 年 11 月 8 日举行。活动以虚拟方式举办,汇集了不同领域的专家,他们围绕生成式人工智能在机器翻译领域的应用这一主题分享了自己的见解和研究成果。Clearly Local 客户成功总监 Jill Huang 在本文中分享了一些讲演活动中的关键收获和宝贵见解,让我们一窥机器翻译的未来及其不断变化的格局。 

主题演讲:大语言模型(LLM)时代的 MT 

Christian Federmann 的主题演讲全面概述了机器翻译技术的进化过程。他追溯了从基于规则和统计的方法到神经网络机器翻译乃至 GPT-4 等大型语言模型的发展历程。Federmann 强调了 GPT-4 的发展迅猛,指出与以前的技术相比,它推陈出新的速度是前所未有的。 

主题演讲生动地回顾了业界对 GPT 的反应,经历了从否认、怀疑最后到接受和迎合的全过程,完全符合“五阶段”悲伤心理学中的描述。最后,Federmann 对未来提出了乐观的愿景,他主张建立一种人类与人工智能协同工作的合作模式,利用各自的优势提高翻译质量。 

语言人工智能的局限 

Kirti Vashee 的演讲强调了生成式人工智能(GenAI)在语言翻译方面的局限性和挑战。他提出了一些关键问题,涉及到 LLMs 是否有潜力取代 NMT,以及它们是否能够解决人类语言的复杂性。Vashee 指出了包括可信度、适配成本、数据安全,以及在建模人类语言必将面对的挑战,等一系列意义重大的问题。 

一个关键的观察结果是,英语对模型的表现起着主导地位,也就是说模型在语言包容性上存在很多值得关注的问题。Vashee 指出,虽然像 GPT-4 这样的 LLM 整体表现良好,但与传统的 MT 模型相比,它们的响应时间长和运营成本高等问题对大规模生产应用依然构成了挑战。 

GenAI 无边,回头是 MT 

Konstantin Savenkov 的发言侧重于一项用于评估 GenAI 模型的跨语言翻译能力的研究。该研究探讨了 GenAI 模型在英语和其他语言中是否同样有效,以及不同的提示语言是否会影响最终表现。 

研究涵盖了对西班牙语、法语、简体中文和乌克兰语等语言在多个 LLM 模型上的测试。有些模型在不切换到英语的情况下依然表现良好,而其他一些模型明显在使用英语做源语言进行翻译时表现更好。这一发现凸显了目前 LLM 以英语为中心的特性,以及在确保不同语言平等的问题上所面临的挑战。 

“无人驾驶”的生成式 AI 

Adam Bittlingmayer 在发言中将 AI 在自动驾驶技术与语言生成上的应用做了类比。他认为,就像自动驾驶汽车存在局限性需要人工干预一样,人工智能在语言生成方面也应采用混合方法。 

Bittlingmayer 强调了只有认识到 AI 在语言有关任务上的局限性,才能指向最终建立一个人工智能知道何时向人类专业技能让步的系统。他特别举出了翻译记忆库以及机器翻译质量预测等例子,讲解人工智能与人力有效结合的混合系统如何工作。 

精调 LLM 以实现人工干预 

Serge Gladkoff 讨论了如何使用经过精细调整的大型语言模型(LLMs)来预测在机器翻译中需要人类干预的情况。该演示围绕一项使用机器译后编辑历史数据来训练 LLM 以识别可能无需编辑语段的研究而展开。 

Gladkoff 的研究展示了 LLM 的实际应用,证明了其从过去的数据中学习并做出准确预测的能力。这种方法可以提高翻译过程的效率,将人力集中在最需要其专业知识的环节上。 

结论:迈向协同增效的未来 

Jill Huang 深深体会到并指出 AMTA 2023 活动充分体现了机器翻译领域正处于动态的发展过程中。LLM 与 MT 的相结合显然具有良好的发展前景,但同时也充满了挑战。活动中来自意见领袖的分享无疑非常具有指导意义,尤其是在语言 AI 与 MT 技术仍处于摸着石头过河阶段的情况下。 

Clearly Local 站在这个不断变化的领域的前沿,利用任何进步来加强我们的翻译和本地化服务。我们致力于采用最新的语言 AI 和 MT 技术,这与 AMTA 2023 大会上提出的趋势和观点完全一致。我们将坚定地跟上技术变革的步伐,继续在提供精准、符合文化的翻译方面处于引领地位,帮助客户与全球受众产生共鸣。

Clearly Local 深知语言的力量不仅在于文字,更在于跨越文化的适应和沟通能力。我们的专家团队拥有先进的工具和对语言细微差别的深刻理解,确保每一份翻译都能超越文字表面意思,抓住原始内容的精髓。我们为能够加入机器翻译变革之旅而兴奋,并始终致力于为客户提供,不仅仅是翻译,更是建立通向世界的桥梁的解决方案。