关注AI前沿科技动态与爱眸科技的最新探索
2025年11月17日,谷歌发布Gemini 3,实现了AI多模态能力的跨越式突破。
Gemini 3首次将文字、语音、图片、视频、代码等多种模态压缩进同一向量空间,模型真正实现了"看见+听见+理解"。可生成可点击交互的小程序、动态动画来解释复杂概念——例如用动态模拟展示RNA聚合酶工作原理、等离子体流动过程等。
多项基准测试中,Gemini 3大幅超越GPT-5.1和Claude Sonnet 4.5。Gemini 3 Flash版本输入价格仅$0.5/百万Tokens,输出$3/百万Tokens——不到GPT-5.2的近1/5。
Gemini 3发布后直接触发OpenAI内部拉响"红色警报"(Code Red),迫使加速GPT-5.2的发布进程。2025年末的AI竞赛从"谁的模型更聪明"转向了"谁的模型更全能"。