AI资讯新闻榜单内容搜索-GPT

token级，精准控制生成长度：3B模型击败GPT 5.4、Claude

LenVM将长度建模提升到token级别，开辟可扩展价值预训练的新维度——3B开源模型精确长度控制全面击败GPT-5.4、Claude-Opus-4-6等顶级闭源模型；相同token预算下推理准确率提升10倍（63% vs 6%）；沿模型规模、数据量、采样数三轴无饱和scaling的value pretraining

来自主题: AI技术研报

5649 点击 2026-05-08 14:06

OpenAI 推出三款实时语音模型，可边听边「思考」、翻译和转录

不知道大家平时有没有这种经历。

来自主题: AI资讯

7380 点击 2026-05-08 10:18

0%完成率！Claude、GPT、Gemini 全灭，SWE-Bench作者新作把AI圈干沉默了

SWE-Bench 的创建者，刚刚又放出了一个地狱级新 benchmark。

来自主题: AI技术研报

10012 点击 2026-05-07 15:31

刷榜AI全挂了！Meta斯坦福地狱级测试，GPT/Claude/Gemini交出0分

SWE-Bench上能拿72%的模型，换张考卷直接归零！Meta联合斯坦福、哈佛放出ProgramBench，200个项目从零手写，9大顶级模型完整通过率0%。最强的Claude Opus 4.7平均通过率也才51.2%。更离谱的是一联网，就有模型在36%的任务里跑去GitHub扒源码。

来自主题: AI技术研报

6162 点击 2026-05-07 12:03

OpenAI 选中的 37 名「超级大学生」，厉害在哪？做了什么？

OpenAI 揭晓了 ChatGPT Futures 项目，为 37 名年轻人提供了 1 万美元的无偿资助、前沿模型访问权限，并邀请他们 6 月去总部参访

来自主题: AI资讯

6007 点击 2026-05-07 11:02

Luma Uni-1.1 API开放，图像模型榜单第三，文字渲染直逼GPT image 2

今年以来，图像生成模型的迭代节奏明显加快。

来自主题: AI技术研报

9658 点击 2026-05-06 15:17

ChatGPT正式上线广告主平台，AI产品从今天开始走向分裂。

OpenAI准备向企业主全量上线广告平台了。这个非常有意思，我觉得还是可以聊聊的。这玩意你可以理解成，ChatGPT的广告投放后台，美国的企业主可以直接注册账号，充钱，设预算，选竞价策略，上传广告素材，然后一键投放到ChatGPT的对话里，最后实时看数据，实时优化。

来自主题: AI资讯

8561 点击 2026-05-06 10:19

刚刚，ChatGPT免费模型升级了：幻觉砍半/记忆更强/回答更简洁

ChatGPT默认模型，今天大升级。

来自主题: AI资讯

5849 点击 2026-05-06 09:50

5月5日5点55分，GPT-5.5自己选客人开派对！Codex反超Claude Code

5月5日下午5:55，GPT-5.5要给自己办场party——时间是GPT-5.5自己挑的，客人由Codex从推文回复里挑。这场看起来像段子的活动背后，是一个真实的市场拐点：过去两个月，AI编程工具圈发生了一次明显的用户迁移，开发者开始从Claude Code转向Codex。

来自主题: AI资讯

7566 点击 2026-05-06 09:49

刚刚，GPT-5.5 Instant 发布，奥特曼还邀请马斯克参加 AI 办的派对

就在刚刚，OpenAI 正式发布了 GPT-5.5 Instant，将其设为 ChatGPT 的默认模型，取代此前的 GPT-5.3 Instant，面向所有用户开放。Instant 系列是 ChatGPT 的日常主力模型，每天有数以亿计的用户在用。官方说，在这个量级上，哪怕只是小幅改进，积累起来的效果也相当可观。

来自主题: AI资讯

9605 点击 2026-05-06 08:07