AI资讯新闻榜单内容搜索-模型训练

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 模型训练

LLM 仅靠自身就能增强推理？SePT 给出简洁在线自训练范式

LLM 仅靠自身就能增强推理？SePT 给出简洁在线自训练范式

LLM 仅靠自身就能增强推理？SePT 给出简洁在线自训练范式

在推理后训练里，多数方法仍依赖奖励模型、验证器或额外教师信号。如果不依赖这些外部信号，只使用模型自身生成的答案进行自训练，是否仍然能够提升推理能力？是的！SePT（Self-evolving Post-Training）给出肯定答案，简洁的自训练方法，可在数学推理任务准确率直升10个点！

来自主题: AI技术研报

6159 点击 2026-04-23 14:05

首篇自进化智能体系统技术报告出炉：Token成本直降近10倍，省钱又高效！

首篇自进化智能体系统技术报告出炉：Token成本直降近10倍，省钱又高效！

首篇自进化智能体系统技术报告出炉：Token成本直降近10倍，省钱又高效！

当 AI 智能体不再只是「一次性工具」，而是能够持续学习、自我进化的「数字伙伴『数字同事』，会发生什么？自进化智能体应该采取怎样的设计原则？

来自主题: AI技术研报

8927 点击 2026-04-23 14:04

都是你能部署的：Qwen3.6和Gemma4，谁更适合作为你的下一代本地MoE模型？

都是你能部署的：Qwen3.6和Gemma4，谁更适合作为你的下一代本地MoE模型？

都是你能部署的：Qwen3.6和Gemma4，谁更适合作为你的下一代本地MoE模型？

阿里前几天开源的Qwen3.6-35B-A3B，让这次讨论不再只是一次普通的新旧模型对比。它一边要面对谷歌Gemma4-26B-A4B的外部竞争，一边又必须回答一个更麻烦的问题：相较于 Qwen3.5-35B-A3B，它到底是升级，还是修补？更现实的是，很多人现在真正跑着的，其实是Qwen3.5-27B，那么这条新的35B-A3B路线，到底值不值得迁过去。

来自主题: AI技术研报

9633 点击 2026-04-23 09:23

ICLR 2026 Oral｜Information Shapes Koopman Representation：信息如何决定世界模拟？

ICLR 2026 Oral｜Information Shapes Koopman Representation：信息如何决定世界模拟？

ICLR 2026 Oral｜Information Shapes Koopman Representation：信息如何决定世界模拟？

大多数世界模型工作默认：只要学到一个好的 latent dynamics，问题就解决了。但这个假设本身是可疑的——什么样的信息，才足以支撑一个可预测、可传播的动力学？本文从信息论出发，重新审视这一前提。

来自主题: AI技术研报

9601 点击 2026-04-23 09:20

中科大团队放大招：8B小模型碾压GPT-5.2和Claude，Agent工具调用的「基建革命」来了！

中科大团队放大招：8B小模型碾压GPT-5.2和Claude，Agent工具调用的「基建革命」来了！

中科大团队放大招：8B小模型碾压GPT-5.2和Claude，Agent工具调用的「基建革命」来了！

先说一个很多人没意识到的事实：2026年了，每个主流Agent框架底下的工具调用训练数据，格式全是乱的。

来自主题: AI资讯

10637 点击 2026-04-22 09:12

国产多模态Agent拿下医学分割SOTA！不用改模型、不加token | 浙大&上海AI Lab

国产多模态Agent拿下医学分割SOTA！不用改模型、不加token | 浙大&上海AI Lab

国产多模态Agent拿下医学分割SOTA！不用改模型、不加token | 浙大&上海AI Lab

这个生物医学视觉推理框架，被CVPR 2026接收了！

来自主题: AI技术研报

6731 点击 2026-04-22 09:11

普通网线也能跑万亿大模型！月之暗面抛出王炸架构，亲证：不用全买 H100！1T模型实测：延迟暴降64%！大模型推理“围城”攻破了！

普通网线也能跑万亿大模型！月之暗面抛出王炸架构，亲证：不用全买 H100！1T模型实测：延迟暴降64%！大模型推理“围城”攻破了！

普通网线也能跑万亿大模型！月之暗面抛出王炸架构，亲证：不用全买 H100！1T模型实测：延迟暴降64%！大模型推理“围城”攻破了！

在 AI 工程界，长文本推理一直是个“富贵病”。

来自主题: AI技术研报

8549 点击 2026-04-21 16:16

行动奇点降临！Mythos把AI从「会说」跨进「动手」时代

行动奇点降临！Mythos把AI从「会说」跨进「动手」时代

行动奇点降临！Mythos把AI从「会说」跨进「动手」时代

Anthropic把最强Claude Mythos亲手锁进笼子，因为它第一次让世界看清：AI正在从「会说」跨进「会做」，奇点已经不再只是想象。

来自主题: AI资讯

7410 点击 2026-04-21 16:15

动动嘴写SQL！Codex+终身记忆，OpenAI把查询难度直接归零

动动嘴写SQL！Codex+终身记忆，OpenAI把查询难度直接归零

动动嘴写SQL！Codex+终身记忆，OpenAI把查询难度直接归零

2026年初，当大多数企业还在用数据分析师手动写SQL查表时，OpenAI内部曝光的能自主思考、推理甚至自我进化的数据分析智能体，将数据查询从「天数级」缩短至「分钟级」。

来自主题: AI技术研报

5936 点击 2026-04-21 10:24

跨维智能DexWorldModel斩获榜首，世界模型真正的考场在机器人执行里

跨维智能DexWorldModel斩获榜首，世界模型真正的考场在机器人执行里

跨维智能DexWorldModel斩获榜首，世界模型真正的考场在机器人执行里

今年4月，具身智能领域发生了一件看起来不大、但意味深长的事。

来自主题: AI技术研报

9522 点击 2026-04-21 09:37

上一页当前第38页,共418页下一页