2025-12-11

OpenAI紧急发布GPT-5.2:70.7%高难度任务达人类专家水平

面对Gemini 3的压力,OpenAI以"红色代码"紧急状态加速发布GPT-5.2。Think版本在70.7%的高难度真实工作任务中优于或持平行业顶尖专家,速度是人类的3倍,成本仅为1%,被评价为"真正开始抢饭碗"的一代模型。

GPT-5.2 OpenAI 推理 Agent OpenAI · 2025年12月11日
2025-11-17

谷歌Gemini 3发布:原生多模态实现"看到+听见",多项基准大幅领先

谷歌发布Gemini 3,首次实现文字、语音、图片、视频、代码的原生多模态融合——所有模态被压缩进同一向量空间。多项基准测试大幅超越GPT-5.1和Claude Sonnet 4.5,直接触发OpenAI内部拉响"红色警报"。

Gemini 多模态 谷歌 OpenAI Google · 2025年11月17日
2025-10-22

欧盟AI法案全面生效:全球首个AI治理框架进入实施阶段

欧盟AI法案(EU AI Act)于2025年全面生效,成为全球首个具有法律约束力的AI治理框架。法案要求基础模型公开训练数据来源、能耗及偏差测试结果,违规罚款可达全球年营业额的6%。全球AI企业加速合规布局。

AI监管 欧盟法案 合规 AI治理 EU Commission · 2025年10月
2025-09-28

北京开放自动驾驶高速测试:超200公里路段,时速120公里

北京市正式开放京哈、京承高速公路部分路段用于自动驾驶车辆测试,总里程超200公里,允许测试车速达120km/h。这是中国自动驾驶商业化进程中的重要里程碑,标志着L4级自动驾驶从城市道路向高速场景拓展。

自动驾驶 L4 北京 高速测试 北京市政府 · 2025年9月28日
2025-09-15

DeepSeek-R1登上《自然》封面:全球首个经同行评审的主流大语言模型

中国AI公司DeepSeek的R1推理模型登上《自然》封面,成为全球首个经过同行评审的重要大语言模型。其核心创新在于"纯强化学习"训练方法,无需大规模人工标注即可实现卓越推理能力,训练成本仅为西方同类型号的数分之一。

DeepSeek Nature 推理模型 中国AI Nature · 2025年9月
2025-08-08

OpenAI发布GPT-5:统一架构、价格屠夫,编程能力超越人类专家

OpenAI正式发布GPT-5,首次将GPT系列与o系列推理能力合并为单一系统,API价格仅为Claude Opus 4.1的1/15。编程能力登顶成为新王,支持自我修复Bug的代理式编码,上下文扩展至400K token。

GPT-5 OpenAI 大模型 编程AI OpenAI · 2025年8月8日
1 2 3 4

关注爱眸科技,获取更多行业洞察

如有技术合作或商务咨询需求,欢迎与我们联系。