语言翻译是人工智能与机器学习领域的一大奇迹,它极大地推动了全球交流的深化与扩展。如今,大型语言模型(LLM)的引入更是让翻译工作迈上了新台阶,无论是翻译的质量、准确性还是效率,都实现了质的飞跃。


像 Gemini 这样的大型语言模型,凭借其强大的文本理解和生成能力,已经成为翻译领域的佼佼者。它们经过海量且多样化的数据集训练,能够精准捕捉不同语言的语法、语义和微妙之处,为我们带来更加细腻、精准的翻译结果,解决了过去许多棘手的语言难题。


而在最近的 Next 大会上,Gemini Pro 1.5 的发布更是为我们带来了更多惊喜。现在,在谷歌云上,我们拥有了更多样化的翻译产品选择。无论你的需求是什么,预算如何,都能找到最适合你的翻译工具。




Cloud Translation


👉 Translation API


Translation API 是我们在大模型出现之前最常使用的翻译 API,使用 Google 预训练的神经机器翻译 (NMT) 模型来进行翻译,同时可以叠加使用术语表等来进行个性化的翻译。相比于大模型,Translation API 可以提供更多种类的语言支持以及更低延迟的返回结果,同时每次同样的输入返回的内容基本准确一致,但也正因如此,用户无法对调用 API 返回的结果做出优化。默认的 Google 神经机器翻译 (NMT) 模型涵盖多种语言,能够很好地处理一般文本。但是,如果您要翻译特定领域或注重风格的文本,则自定义翻译可以帮助您得到更贴合要求的翻译。


自定义翻译要求您提供自己的示例翻译。Cloud Translation 随后可以生成密切遵循示例的风格、语气和词汇的结果。


👉 AutoML


借助 AutoML Translation,您可以导入自己的数据来训练归您所有并由您维护的自定义模型。构建自定义模型后,即可以请求使用您的模型(而不是默认 NMT 模型)的翻译。与自适应翻译相比,自定义模型非常适合特定领域的文本,在这类情况下,获得正确的术语是最优先的要求。您还需要提供较大的数据集来进行模型训练。


您需要根据模型训练时间和您发送进行翻译的输入字符数付费。


👉 自适应翻译


自适应翻译将 LLM 与小型数据集结合使用来提供高质量翻译,通常堪比 AutoML Translation 自定义模型。您无需训练或维护任何模型。与自定义模型相比,自适应翻译能够提供在风格、语气和语态方面与您的输入相似的响应。


但目前自适应翻译支持的语言数量有限。




生成式AI


👉 基础 LLM


我们可以基于通用的大模型来写 prompt 帮助我们进行翻译,LLM 和机器学习对于同音异义丰富的语言特别有帮助,这些语言的上下文在很大程度上影响了单词的含义。在所有这些例子中,LLM 展示了对语言特征、文化细微差别和语法复杂性的深刻理解,这些特征使每种语言都独一无二,从而产生更准确、自然和上下文合理的翻译。这最终比以往更有效地弥合了不同语言之间的沟通差距。


在 Next 大会上,谷歌新发布了 Gemini 1.0 Pro 002(Text Only)和 Gemini 1.5 Pro,用户可以选择尝试多种模型来达到最适合自己的效果。




 基于 LLM 进行 fine-tune


在大型语言模型的上下文中进行微调是指我们采用现有的经过训练的模型,并在新数据集上继续训练过程,该新数据集比模型训练所用的原始数据集更小且更特定于领域,以实现特定的用例结果。




调整参数执行之后会生成一个部署端点,用户可以通过该端点进行 API 调用(谷歌部署的 Endpoint 不收取 host 费用,同时 API 调用的价格和基础模型相同)




Google Translation API 基于谷歌多年积累的机器翻译技术,经过大量数据的训练和优化,提供稳定且高质量的翻译结果,但无法像大语言模型那样根据上下文进行动态调整,翻译结果可能较为刻板。大语言模型能够理解上下文,根据语境进行动态调整,翻译结果更加自然流畅,可以根据需要生成不同风格的译文,例如正式、口语化等。但是大语言模型的输出结果可能存在不确定性,需要进行人工审核和控制。


返回全部