AI重磅｜谷歌连发AI两大招：Gemini 3.5实时同声传译70+语言，开源DiffusionGemma速度暴涨4倍（6月11日）

2026-06-11 AI-Pick - 精选AI工具导航已浏览6次

2026年6月11日，谷歌在AI领域连续放出两大重磅消息，同时覆盖了实时翻译和开源模型两个方向，展示了其在基础模型和产品应用层面的双重实力。

谷歌今日正式发布Gemini 3.5 Live Translate，这是一项基于Gemini 3.5多模态能力的实时语音翻译功能，支持70多种语言的实时同声传译。

与传统翻译工具 "等你说完再翻译" 的模式不同，Live Translate实现了边听边译的实时体验，延迟仅几秒钟，并且能够保留原文的语气和情感色彩。无论是商务会议、跨国直播还是日常交流，沟通流畅度都有了质的飞跃。

这项功能的推出，意味着AI实时翻译正式进入 "同声传译时代"。对于跨境商务、国际会议、内容创作等场景，Gemini 3.5 Live Translate将大幅降低语言壁垒，提升全球协作效率。

在Gemini 3.5 Live Translate的聚光灯之外，谷歌还发布了DiffusionGemma——一个采用扩散模型方案生成文字的开源语言模型。

DiffusionGemma的最大亮点是速度：在H100 GPU上每秒可生成超过1000个token，速度比同规格的自回归模型快约4倍。更令人惊喜的是，该模型在RTX 4090这样的消费级显卡上即可流畅运行，让个人开发者也能轻松部署。

采用Apache 2.0开源协议意味着商业使用几乎没有限制，为社区二次开发和商用部署铺平了道路。

一天之内连发两款截然不同的AI产品，体现了谷歌 "双线作战" 的战略：产品端以Gemini 3.5的实时能力抢占用户场景，开源端以DiffusionGemma的极速推理吸引开发者生态。

实时同传解决了 "用"的问题，开源扩散模型解决了 "跑"的问题——前者降低沟通门槛，后者降低算力门槛。这种从应用到基础设施的全面覆盖，正在重新定义AI平台的竞争维度。