AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
LLM 仅靠自身就能增强推理?SePT 给出简洁在线自训练范式

LLM 仅靠自身就能增强推理?SePT 给出简洁在线自训练范式

LLM 仅靠自身就能增强推理?SePT 给出简洁在线自训练范式

在推理后训练里,多数方法仍依赖奖励模型、验证器或额外教师信号。如果不依赖这些外部信号,只使用模型自身生成的答案进行自训练,是否仍然能够提升推理能力?是的!SePT(Self-evolving Post-Training)给出肯定答案,简洁的自训练方法,可在数学推理任务准确率直升10个点!

来自主题: AI技术研报
6159 点击    2026-04-23 14:05
首篇自进化智能体系统技术报告出炉:Token成本直降近10倍,省钱又高效!

首篇自进化智能体系统技术报告出炉:Token成本直降近10倍,省钱又高效!

首篇自进化智能体系统技术报告出炉:Token成本直降近10倍,省钱又高效!

当 AI 智能体不再只是「一次性工具」,而是能够持续学习、自我进化的「数字伙伴『数字同事』,会发生什么?自进化智能体应该采取怎样的设计原则?

来自主题: AI技术研报
8927 点击    2026-04-23 14:04
都是你能部署的:Qwen3.6和Gemma4,谁更适合作为你的下一代本地MoE模型?

都是你能部署的:Qwen3.6和Gemma4,谁更适合作为你的下一代本地MoE模型?

都是你能部署的:Qwen3.6和Gemma4,谁更适合作为你的下一代本地MoE模型?

阿里前几天开源的Qwen3.6-35B-A3B,让这次讨论不再只是一次普通的新旧模型对比。它一边要面对谷歌Gemma4-26B-A4B的外部竞争,一边又必须回答一个更麻烦的问题:相较于 Qwen3.5-35B-A3B,它到底是升级,还是修补?更现实的是,很多人现在真正跑着的,其实是Qwen3.5-27B,那么这条新的35B-A3B路线,到底值不值得迁过去。

来自主题: AI技术研报
9633 点击    2026-04-23 09:23
ICLR 2026 Oral|Information Shapes Koopman Representation:信息如何决定世界模拟?

ICLR 2026 Oral|Information Shapes Koopman Representation:信息如何决定世界模拟?

ICLR 2026 Oral|Information Shapes Koopman Representation:信息如何决定世界模拟?

大多数世界模型工作默认:只要学到一个好的 latent dynamics,问题就解决了。 但这个假设本身是可疑的——什么样的信息,才足以支撑一个可预测、可传播的动力学? 本文从信息论出发,重新审视这一前提。

来自主题: AI技术研报
9601 点击    2026-04-23 09:20
普通网线也能跑万亿大模型!月之暗面抛出王炸架构,亲证:不用全买 H100!1T模型实测:延迟暴降64%!大模型推理“围城”攻破了!

普通网线也能跑万亿大模型!月之暗面抛出王炸架构,亲证:不用全买 H100!1T模型实测:延迟暴降64%!大模型推理“围城”攻破了!

普通网线也能跑万亿大模型!月之暗面抛出王炸架构,亲证:不用全买 H100!1T模型实测:延迟暴降64%!大模型推理“围城”攻破了!

在 AI 工程界,长文本推理一直是个“富贵病”。

来自主题: AI技术研报
8549 点击    2026-04-21 16:16
行动奇点降临!Mythos把AI从「会说」跨进「动手」时代

行动奇点降临!Mythos把AI从「会说」跨进「动手」时代

行动奇点降临!Mythos把AI从「会说」跨进「动手」时代

Anthropic把最强Claude Mythos亲手锁进笼子,因为它第一次让世界看清:AI正在从「会说」跨进「会做」,奇点已经不再只是想象。

来自主题: AI资讯
7410 点击    2026-04-21 16:15
动动嘴写SQL!Codex+终身记忆,OpenAI把查询难度直接归零

动动嘴写SQL!Codex+终身记忆,OpenAI把查询难度直接归零

动动嘴写SQL!Codex+终身记忆,OpenAI把查询难度直接归零

2026年初,当大多数企业还在用数据分析师手动写SQL查表时,OpenAI内部曝光的能自主思考、推理甚至自我进化的数据分析智能体,将数据查询从「天数级」缩短至「分钟级」。

来自主题: AI技术研报
5936 点击    2026-04-21 10:24