← 返回新闻列表
2025-11-17

谷歌Gemini 3发布:原生多模态实现"看到+听见",多项基准大幅领先

Gemini 多模态 谷歌 OpenAI

2025年11月17日,谷歌发布Gemini 3,实现了AI多模态能力的跨越式突破。

原生多模态

Gemini 3首次将文字、语音、图片、视频、代码等多种模态压缩进同一向量空间,模型真正实现了"看见+听见+理解"。可生成可点击交互的小程序、动态动画来解释复杂概念——例如用动态模拟展示RNA聚合酶工作原理、等离子体流动过程等。

性能碾压

多项基准测试中,Gemini 3大幅超越GPT-5.1和Claude Sonnet 4.5。Gemini 3 Flash版本输入价格仅$0.5/百万Tokens,输出$3/百万Tokens——不到GPT-5.2的近1/5。

Code Red

Gemini 3发布后直接触发OpenAI内部拉响"红色警报"(Code Red),迫使加速GPT-5.2的发布进程。2025年末的AI竞赛从"谁的模型更聪明"转向了"谁的模型更全能"。

来源:Google · 2025年11月17日

关注爱眸科技,获取更多行业洞察

如有技术合作或商务咨询需求,欢迎与我们联系。