AI资讯新闻榜单内容搜索-2

ICLR 2026 Oral | DPO「只看总分不看细节」？TI-DPO用Token重要性重塑大模型对齐

在当今的大模型后训练（Post-training）阶段，DPO（直接偏好优化）凭借其无需训练独立 Reward Model 的优雅设计和高效性，成功取代 PPO 成为业界的「版本之子」，被广泛应用于 Llama-3、Mistral 等顶流开源模型的对齐中。

来自主题: AI技术研报

7468 点击 2026-02-11 13:58

来一手Qwen-Image-2.0实测，好像还不错？！

BUBBLE 2026 — ISSUE #18 家人们，马上没几天快过年了，明显各个厂商已经开始疯狂卷了。上周到现在，让我们来算算有多少东西了， 5.3 Codex，4.6 Opus，可灵3.0

来自主题: AI产品测评

10466 点击 2026-02-11 12:43

OpenClaw 让 Mac Mini 卖爆了，苹果为什么不自己做一个？

谁能想到，2026 年第一款热销设备，是被 OpenClaw 带飞的 Mac Mini——一个一直以来在苹果产品序列里，都不温不火的存在，就这样硬生生地被拉了起来。

来自主题: AI资讯

10802 点击 2026-02-11 12:39

Seedance 2.0让字节元神启动

Seedance 2.0用了两天，个人感想是，以下几类人群或即将失业：一、把「学好提示词」奉为圭臬，并开班传授佶屈聱牙反逻辑长难句prompt的AI导师。二、成本只有一个自拍杆的所谓短视频博主。三、刚开始做AI社交的小创业者。

来自主题: AI产品测评

9093 点击 2026-02-11 12:38

Ditto融资920万美金，让AI帮你安排约会，做AI时代的Facebook

当我深入了解Ditto的运作方式后，我发现这不仅仅是一个新的约会服务，而是对整个约会行业商业模式的根本性挑战。传统约会App的商业逻辑是让你尽可能长时间地停留在App上，因为这样才能产生更多广告收入和会员订阅。

来自主题: AI资讯

8324 点击 2026-02-11 12:36

ICLR 2026 | 在Moltbook之外，上交大联合上海AI Lab模拟了AI原⽣社交的「真实暗⾯」

本⽂的主要作者来⾃上海交通⼤学和上海⼈⼯智能实验室，核⼼贡献者包括任麒冰、郑志杰、郭嘉轩，指导⽼师为⻢利庄⽼师和邵婧⽼师，研究⽅向为安全可控⼤模型和智能体。最近，Moltbook 的爆⽕与随后的迅速

来自主题: AI技术研报

10041 点击 2026-02-11 12:32

小众架构赢麻了！通过编辑功能 LLaDA2.1 让100B扩散模型飙出892 tokens/秒的速度！

谁能想到啊，在自回归模型（Autoregressive，AR）当道的现在，一个非主流架构的模型突然杀了回马枪——被长期视为学术玩具的扩散语言模型，直接在复杂编程任务中飙出了892 tokens/秒的速度！

来自主题: AI资讯

10612 点击 2026-02-11 10:47

比肩OpenAI Simple Codex，中国团队Feeling AI闯入Terminal-Bench全球第二！

就在这个被 Anthropic 和 OpenAI 视为衡量 Agent 真实工程能力全球权威基准 Terminal-Bench 2.0 榜单上，中国团队 Feeling AI 凭借 CodeBrain-1，搭载最新 GPT-5.3-Codex 底座模型，一举冲到 72.9%(70.3%) 并跻身全球排行榜第二，成为榜单前 10 中唯一的中国团队。

来自主题: AI资讯

10948 点击 2026-02-10 18:51

字节发完阿里发！Qwen-Image 2.0火线出击

今天，阿里巴巴发布了新一代图像生成基础模型Qwen-Image 2.0，这一模型支持长达一千个token的超长指令、2k分辨率，并采用了更轻量的模型架构，模型尺寸远小于Qwen-Image 2.0的20B，带来更快的推理速度。

来自主题: AI资讯

9777 点击 2026-02-10 18:48

GLM-5架构曝光，智谱两日涨60%：采用DeepSeek同款稀疏注意力

不管Pony Alpha是不是智谱的，下一代旗舰大模型GLM-5都要来了。GLM-5采用了DeepSeek-V3/V3.2架构，包括稀疏注意力机制（DSA）和多Token预测（MTP），总参数量745B，是上一代GLM-4.7的2倍。

来自主题: AI资讯

9366 点击 2026-02-10 16:27