关注AI前沿科技动态与爱眸科技的最新探索
2026年1月,CES 2026大会上,英伟达宣布了史上最大规模的开源AI数据集发布计划。
此次开源的数据集包含10万亿tokens文本语料、50万条机器人运动轨迹、100TB车辆传感器数据等,覆盖NLP、具身智能、自动驾驶等多个AI子领域。这为全球AI开发者提供了前所未有的训练资源。
英伟达同时开源Nemotron系列四大模型——覆盖语音识别、RAG检索增强生成、AI安全等领域。Artificial Analysis评价其为"最开放的前沿AI开发技术栈之一"。Nemotron Speech语音识别性能比同类开源方案快10倍。