谷歌发布AI开放翻译模型 TranslateGemma
创始人
2026-01-16 14:45:46

AIPress.com.cn报道

1月16日,谷歌正式发布了 TranslateGemma,这是一套基于 Gemma 3 构建的全新开源翻译模型系列。该系列包含4B、12B 和 27B 三种参数规格,旨在通过极高的效率和精准度,打破全球 55 种语言之间的沟通障碍。

技术评估中最惊人的发现是其效率。通过特殊的训练工艺,12B 版本的 TranslateGemma 在性能上竟然超越了 27B 的 Gemma 3 基线模型(基于 MetricX 指标)。

这意味着开发者可以用不到一半的算力资源,获得同等甚至更好的翻译质量。即便是最小的4B 模型,其实力也足以匹敌更大的 12B 基线模型,非常适合在手机等移动设备上运行。

为什么能做到这一点?谷歌采用了一种“两阶段微调”工艺,将顶尖大模型 Gemini 的“直觉”蒸馏到了这些小模型中:

  1. 监督微调(SFT):使用大量人类翻译文本和 Gemini 生成的高质量合成数据进行训练。

  2. 强化学习(RL):利用 MetricX-QE 等高级奖励模型,指导模型生成更自然、更准确的翻译。

TranslateGemma 不仅精通 55 种核心语言(包括中文),还继承了 Gemma 3 的多模态能力。测试显示,即便没有专门针对图像进行微调,它在图片内文字翻译(如 Vistra 基准)上的表现也随文本翻译能力的提升而增强。

目前,这些模型已在 Kaggle、Hugging Face 和 Vertex AI 上开放下载和部署。

(AI普瑞斯编译)

相关内容

热门资讯

美团开源 LongCat-Fl... 北京商报讯(记者 魏蔚)1月16日,美团宣布,作为LongCat-Flash-Thinking模型的...
同宝山公路入选“公路助力乡村振... 2025年12月10日,交通运输部规划研究院和《中国交通报》联合公布2025年“公路助力乡村振兴”创...
北京环球度假区五周年官宣,九大... 2021年开园至今,北京环球度假区已陪伴游客走过四年难忘时光。1月16日,度假区正式官宣2026年将...
“你好!中国!”旅游宣传片亮相... 来源:滚动播报 (来源:上观新闻) 为持续提升中国旅游形象在欧洲主流出行场景中的可见度,近日,...
甘肃油菜花全攻略:什么时候去?... 甘肃油菜花全攻略:什么时候去?哪里最壮观?敦煌人告诉你! 每年夏天,我的朋友圈都会被金灿灿的油菜花海...