新闻资讯

2025-11-17

谷歌Gemini 3发布：原生多模态实现"看到+听见"，多项基准大幅领先

Gemini 多模态谷歌 OpenAI

2025年11月17日，谷歌发布Gemini 3，实现了AI多模态能力的跨越式突破。

Gemini 3首次将文字、语音、图片、视频、代码等多种模态压缩进同一向量空间，模型真正实现了"看见+听见+理解"。可生成可点击交互的小程序、动态动画来解释复杂概念——例如用动态模拟展示RNA聚合酶工作原理、等离子体流动过程等。

多项基准测试中，Gemini 3大幅超越GPT-5.1和Claude Sonnet 4.5。Gemini 3 Flash版本输入价格仅$0.5/百万Tokens，输出$3/百万Tokens——不到GPT-5.2的近1/5。

Gemini 3发布后直接触发OpenAI内部拉响"红色警报"（Code Red），迫使加速GPT-5.2的发布进程。2025年末的AI竞赛从"谁的模型更聪明"转向了"谁的模型更全能"。

来源：Google · 2025年11月17日