AI资讯新闻榜单内容搜索-8

新架构模型HRM-Text创新纪录！1B参数、1000美元，图灵奖得主都亲自下场了

一个约 1B 参数的模型，在 MATH 上拿到 56.2，在 GSM8K 上拿到 84.5，在 ARC-Challenge 上拿到 81.9。训练成本约 1500 美元，16 块 H100 跑了不到两天。

来自主题: AI技术研报

7964 点击 2026-06-09 14:57

280美元一单！1000名工程师教Claude写好代码

Anthropic自家工程师早已基本不写代码了，却280美元一个任务，花钱请约1000名外部工程师，手把手教Claude Code写出好代码。喂养前沿模型的，终究还是人。

来自主题: AI技术研报

7051 点击 2026-06-09 14:33

土区 Apple ID 开通 ChatGPT Plus 保姆级教程，仅 80 元/月！

不过，好用归好用，常规渠道订阅一个月大概需要 140 元，长期积累下来也是一笔不小的开销。最近我研究了不同的订阅途径，发现通过土耳其区进行订阅，费用大概能省下一半。

来自主题: AI资讯

11043 点击 2026-06-09 10:49

突发！OpenAI秘密递表冲刺万亿IPO，奥特曼许诺人手一个AGI

刚刚，OpenAI秘密递交IPO申请，即将冲刺万亿市值！奥特曼扔出使命宣言，2028年让AI进行自我研究，给地球上每个人发一个属于自己的AGI。

来自主题: AI资讯

10598 点击 2026-06-09 10:03

降维打击！数学博士熬秃头，AI数学家：上午出题，下午4点交证明

自今年2月以来，AxiomProver已让8篇覆盖最硬核领域的AI论文现身arXiv，6篇正在筹备。上午出题下午交卷的节奏，让博士生秃头、教授评职称的日子一去不复返。接下来AI能做到什么？

来自主题: AI资讯

8933 点击 2026-06-09 10:02

高德重磅发布3D原生城市世界模型ABot-Earth0.5，把地球玩成了《我的世界》！

6月8日，高德重磅发布了全球首个3D原生城市世界模型——ABot-Earth0.5。ABot-Earth0.5的发布不仅宣告着城市级场景3D原生技术的重要突破，更彻底重塑了传统3D建模的生产逻辑与成本结构。

来自主题: AI资讯

9443 点击 2026-06-08 18:59

刚刚，Mind Lab开源V1系列模型Preview，749B参数，专为Agent 后训练

过去一个多月，大模型圈依旧热闹。从 GPT-5.5、DeepSeek V4 到 Claude Opus 4.8，后训练正在成为模型能力提升的关键引擎。

来自主题: AI技术研报

6339 点击 2026-06-08 15:29

一个8×8矩阵，让大模型「记住」长对话：Mind Lab联合NTU、复旦推出δ-mem，参数仅0.12%

不扩上下文窗口、不换骨干架构、不做全参数微调 —— 只需要一个 8×8 的在线状态矩阵，就能让冻结的 Transformer 拥有真正的长期记忆。

来自主题: AI技术研报

10125 点击 2026-06-08 14:50

独家！继豆包后，千问APP内测“AI帮我挑”备战618

春节AI大战过去仅半年不到，千问、豆包这两大AI产品又在618期间隔空“赛跑”。《读佳》获知，在618电商大促前夕，千问APP正悄悄内测“AI帮我挑”的全新功能，这是千问与淘宝全面互通后的又一关键布

来自主题: AI资讯

8855 点击 2026-06-08 10:23

37万次真实会话实测Agent榜单：GPT-5.5High第一，Claude最稳，真实干活能力看这五项核心指标

6月4日，Arena.ai发布Agent Arena排行榜，用373,431次真实会话的数据，给18个主流模型的Agent能力排了个座次。先看总榜。Agent Arena的排名依据是“净改进”（Net Improvement），用因果推断方法算出每个模型相对于随机基线的性能提升幅度。正值代表比随机选择更好，负值说明不如随机。

来自主题: AI技术研报

9475 点击 2026-06-07 14:38