AI资讯新闻榜单内容搜索-Odin

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Odin
深度|Karpathy为何突然加入Anthropic,只能当Dario的「-2」?

深度|Karpathy为何突然加入Anthropic,只能当Dario的「-2」?

深度|Karpathy为何突然加入Anthropic,只能当Dario的「-2」?

5 月 19 日,OpenAI 联合创始人、「Vibe Coding」之父 Andrej Karpathy 宣布加入 Anthropic 预训练团队。他将组建新团队,用 Claude 加速预训练研究。一个做过Hinton和李飞飞学生、奥特曼同事、马斯克直属下属的人,为什么甘愿做 Dario Amodei 的「-2」?Anthropic 又为什么非要招他?

来自主题: AI资讯
9765 点击    2026-05-20 10:14
花了1000倍的token,效果可能却没有更好:AI Agent的“隐性账单”长什么样

花了1000倍的token,效果可能却没有更好:AI Agent的“隐性账单”长什么样

花了1000倍的token,效果可能却没有更好:AI Agent的“隐性账单”长什么样

如今的 AI Agent 正在大规模落地,其中应用最广且最受关注的当数 Claude Code,Codex,Cursor 这类 coding agent。过去的一年里,这类 coding agent 产品迭代迅速,在一年内将在 swe-bench- verified 的准确率提高到了 78%+。

来自主题: AI技术研报
6660 点击    2026-05-19 10:00
24小时从零写一个GBA模拟器!GPT-5.5跑出53分登顶,Gemini得了0.8分,底部还有两家交白卷

24小时从零写一个GBA模拟器!GPT-5.5跑出53分登顶,Gemini得了0.8分,底部还有两家交白卷

24小时从零写一个GBA模拟器!GPT-5.5跑出53分登顶,Gemini得了0.8分,底部还有两家交白卷

Mechanize 发布了一项硬核测试:给前沿 AI coding agents 24 小时,用 Rust 从零写一个完整的 Game Boy Advance 模拟器,再和顶级开源模拟器 Mesen2 逐帧对比打分。

来自主题: AI技术研报
7821 点击    2026-05-18 16:48
马斯克人在北京,xAI发布首款Coding Agent

马斯克人在北京,xAI发布首款Coding Agent

马斯克人在北京,xAI发布首款Coding Agent

没错,大洗牌之后,xAI紧锣密鼓地发上重磅新品了——首个Coding Agent,Grok Build。直接在终端运行、专为专业软件工程和复杂编程任务设计……对标的是谁,属于是摆在明面上的。

来自主题: AI资讯
9661 点击    2026-05-15 13:35
ICML 2026 Spotlight| 拒绝盲目猜token,阿里x浙大将投机解码带入弹性预算时代

ICML 2026 Spotlight| 拒绝盲目猜token,阿里x浙大将投机解码带入弹性预算时代

ICML 2026 Spotlight| 拒绝盲目猜token,阿里x浙大将投机解码带入弹性预算时代

随着大模型参数规模持续扩大,推理成本已经成为生产级 LLM 服务的核心瓶颈。投机解码(Speculative Decoding, SD)通过「小模型 draft + 大模型 verify」的方式,将多个候选 token 放到一次目标模型前向中并行验证,从而缓解自回归解码的串行瓶颈。

来自主题: AI技术研报
8106 点击    2026-05-13 15:01
蚂蚁万亿参数思考模型Ring-2.6-1T来了!实测AIME真题难不倒,会写爽文、规划出行

蚂蚁万亿参数思考模型Ring-2.6-1T来了!实测AIME真题难不倒,会写爽文、规划出行

蚂蚁万亿参数思考模型Ring-2.6-1T来了!实测AIME真题难不倒,会写爽文、规划出行

今天,蚂蚁百灵大模型发布Ring-2.6-1T。这是一款面向真实复杂任务场景的万亿级思考模型,目前已上线OpenRouter,并开放限时一周免费体验,后续将正式开源。Ring-2.6-1T加入了可调节的Reasoning Effort机制。开发者可以在high和xhigh两种推理强度之间选择:high面向Agent、Coding、多步工具调用等高频任务

来自主题: AI资讯
9212 点击    2026-05-09 21:30
我 Skill 化了耿同学的「学术打假方法论」,致敬

我 Skill 化了耿同学的「学术打假方法论」,致敬

我 Skill 化了耿同学的「学术打假方法论」,致敬

我一直全程关注他打假的全过程,也一直有个想法:耿同学做的这些,能不能让 AI 分担一部分?这几天我琢磨了很久,也 Vibe Coding 了很久,最后做出来一个初版的 「学术打假 Skill——research-integrity-auditor」。

来自主题: AI资讯
10028 点击    2026-05-08 11:54