顶尖AI竟输给三岁宝宝,BabyVision测试暴露多模态模型硬伤
顶尖AI竟输给三岁宝宝,BabyVision测试暴露多模态模型硬伤过去一年,大模型在语言与文本推理上突飞猛进:论文能写、难题能解、甚至在顶级学术 / 竞赛类题目上屡屡刷新上限。但一个更关键的问题是:当问题不再能 “用语言说清楚” 时,模型还能不能 “看懂”?
来自主题: AI技术研报
10090 点击 2026-01-12 14:07
搜索
过去一年,大模型在语言与文本推理上突飞猛进:论文能写、难题能解、甚至在顶级学术 / 竞赛类题目上屡屡刷新上限。但一个更关键的问题是:当问题不再能 “用语言说清楚” 时,模型还能不能 “看懂”?