AI资讯新闻榜单内容搜索-四大

四大顶级AI对决《文明VI》！Claude「核平」法国，结果还是输了

就在最近，英国前首相府数据科学家Liam Wilkinson，花一个周末搭了76个MCP工具，把Claude、GPT、Gemini等四个顶尖模型扔进了《文明VI》。结果，23场对局打完，其中一个AI造了核弹炸了法国——然后输了。

来自主题: AI资讯

8420 点击 2026-06-28 15:36

让机器人学会「预判接触」：它石智航牵头四大顶尖机构发布TacForeSight，破解精细操作难题

机器人已经学会看见世界，也开始学会摸到世界。但对于真实接触操作而言，仅仅感知当前状态远远不够，机器人还需要预测物理世界接下来会如何变化。擦拭、插接、拧紧，这些人类几乎凭感觉就能完成的动作，对机器人来说却并非易事：接触力度会变化，物体位置会偏移，反馈慢一步，就可能打滑、卡住或丢失。

来自主题: AI技术研报

7175 点击 2026-06-25 15:24

大晓机器完成天使+轮融资，自主研发世界模型Kairos登顶4大具身智能榜单

刚刚，大晓机器人半年融资数亿美元，开悟世界模型同时刷新四大权威榜单第一，4B参数硬刚28B大模型！具身智能的「ChatGPT时刻」真的要来了?

来自主题: AI资讯

7627 点击 2026-06-15 15:08

通向AGI的关键拼图！首篇多模态大模型「音频推理」综述出炉，万字拆解四大前沿路径

想象这样一个惬意的周末：空调带来阵阵凉意，你靠在沙发上看书，突然耳边传来“哒哒哒”的小碎步声，接着，玄关门边传来了一阵清脆、略带急切的“呜呜”声，还伴随着爪尖轻轻扒拉木门的声响。

来自主题: AI技术研报

6106 点击 2026-06-12 10:02

谷歌四大巨头齐聚：蒸馏模型的精髓是“挤柠檬”！Gemini 将用自己写的代码“改进”自己！五年后的谷歌可能只有一款产品

“我们有点处在自己的科技泡沫里。”

来自主题: AI资讯

9795 点击 2026-06-01 13:56

AI四巨头内部报告首度公开：AI正在学会撒谎求生

这不是科幻小说，而是 METR（模型评估与训练研究组织）联合Anthropic、Google、Meta和OpenAI 进行内部红队测试后，发布的首份《前沿风险报告》中披露的真实案例。这是四大巨头第一次允许第三方深入测试他们内部最强、可访问完整思维链（CoT）的模型，并开放非公开的对齐与控制信息。

来自主题: AI技术研报

10167 点击 2026-05-24 10:11

METR 重磅报告：Opus 4.6 作弊率超 80%！AI 在长任务中偷看答案、改评分器、搜 GitHub 抄代码，四大巨头全中招

METR 5 月 19 日发布《前沿风险报告》，Anthropic、Google、Meta、OpenAI 四家公司的内部最强模型全部参与评估。结果触目惊心：在超过 8 小时的长任务中，至少 16% 的"成功"运行经人工审查后被判定为作弊；而 Opus 4.6 在 MirrorCode 隐藏测试任务中，约 80% 的尝试都在试图绕过规则拿分。AI 变强了，也变得更擅长"走捷径"了。

来自主题: AI技术研报

9266 点击 2026-05-22 09:15