AI-Pick - 精选AI工具导航

导航首页 »  文章列表 »  其他资讯

AI重磅|谷歌连发AI两大招:Gemini 3.5实时同声传译70+语言,开源DiffusionGemma速度暴涨4倍(6月11日)

2026-06-11    AI-Pick - 精选AI工具导航    已浏览6次


2026年6月11日,谷歌在AI领域连续放出两大重磅消息,同时覆盖了实时翻译和开源模型两个方向,展示了其在基础模型和产品应用层面的双重实力。


一、Gemini 3.5 Live Translate:实时同声传译来了

谷歌今日正式发布Gemini 3.5 Live Translate,这是一项基于Gemini 3.5多模态能力的实时语音翻译功能,支持70多种语言的实时同声传译。

与传统翻译工具 "等你说完再翻译" 的模式不同,Live Translate实现了边听边译的实时体验,延迟仅几秒钟,并且能够保留原文的语气和情感色彩。无论是商务会议、跨国直播还是日常交流,沟通流畅度都有了质的飞跃。

特性说明
支持语言70+种语言,覆盖全球主要语种
延迟表现数秒级实时同传,远超传统逐句翻译
语气保留保留原文情感和语气,翻译更自然
上线渠道开发者、企业、普通用户全渠道同步上线

这项功能的推出,意味着AI实时翻译正式进入 "同声传译时代"。对于跨境商务、国际会议、内容创作等场景,Gemini 3.5 Live Translate将大幅降低语言壁垒,提升全球协作效率。

二、DiffusionGemma:谷歌悄悄发布的开源模型

在Gemini 3.5 Live Translate的聚光灯之外,谷歌还发布了DiffusionGemma——一个采用扩散模型方案生成文字的开源语言模型。

DiffusionGemma的最大亮点是速度:在H100 GPU上每秒可生成超过1000个token,速度比同规格的自回归模型快约4倍。更令人惊喜的是,该模型在RTX 4090这样的消费级显卡上即可流畅运行,让个人开发者也能轻松部署。

采用Apache 2.0开源协议意味着商业使用几乎没有限制,为社区二次开发和商用部署铺平了道路。

行业解读

一天之内连发两款截然不同的AI产品,体现了谷歌 "双线作战" 的战略:产品端以Gemini 3.5的实时能力抢占用户场景,开源端以DiffusionGemma的极速推理吸引开发者生态。

实时同传解决了 "用"的问题,开源扩散模型解决了 "跑"的问题——前者降低沟通门槛,后者降低算力门槛。这种从应用到基础设施的全面覆盖,正在重新定义AI平台的竞争维度。

→ 收藏 AI Pick 导航站,获取每日AI行业最新动态