AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
ICML 2026|告别「单线程」思维,智能体进化出了原生的并行推理大脑

ICML 2026|告别「单线程」思维,智能体进化出了原生的并行推理大脑

ICML 2026|告别「单线程」思维,智能体进化出了原生的并行推理大脑

近年来,大语言模型在「写得长、写得顺」这件事上进步飞快。但当任务升级到真正复杂的推理场景 —— 需要兵分多路探索、需要自我反思与相互印证、需要在多条线索之间做汇总与取舍时,传统的链式思维(Chain-of-Thought)往往就开始「吃力」:容易被早期判断带偏、发散不足、自我纠错弱,而且顺序生成的效率天然受限。

来自主题: AI技术研报
9501 点击    2026-05-19 10:01
ICML 2026 | 只用少量Thinking Tokens,大模型依然能深度思考

ICML 2026 | 只用少量Thinking Tokens,大模型依然能深度思考

ICML 2026 | 只用少量Thinking Tokens,大模型依然能深度思考

近年来,Chain-of-Thought(CoT)推理已经成为提升大语言模型和多模态大语言模型复杂问题求解能力的重要技术路径。

来自主题: AI技术研报
7051 点击    2026-05-19 10:01
花了1000倍的token,效果可能却没有更好:AI Agent的“隐性账单”长什么样

花了1000倍的token,效果可能却没有更好:AI Agent的“隐性账单”长什么样

花了1000倍的token,效果可能却没有更好:AI Agent的“隐性账单”长什么样

如今的 AI Agent 正在大规模落地,其中应用最广且最受关注的当数 Claude Code,Codex,Cursor 这类 coding agent。过去的一年里,这类 coding agent 产品迭代迅速,在一年内将在 swe-bench- verified 的准确率提高到了 78%+。

来自主题: AI技术研报
7128 点击    2026-05-19 10:00
CVPR 2026 Oral | 清华+阿里发布ViT³:解锁「视觉TTT」新架构,突破Transformer复杂度瓶颈

CVPR 2026 Oral | 清华+阿里发布ViT³:解锁「视觉TTT」新架构,突破Transformer复杂度瓶颈

CVPR 2026 Oral | 清华+阿里发布ViT³:解锁「视觉TTT」新架构,突破Transformer复杂度瓶颈

序列建模是大语言模型、计算机视觉等领域的基础共性问题。当前通用的 Transformer 模型计算复杂度随序列长度平方增长,在长序列任务中面临显著的计算挑战。因此,研究者们一直在探索具有线性计算复杂度的高效序列建模方法。

来自主题: AI技术研报
5989 点击    2026-05-18 15:30
LLM助力突破尘封60年数学猜想!北大王立威团队大幅刷新斯坦纳比下界

LLM助力突破尘封60年数学猜想!北大王立威团队大幅刷新斯坦纳比下界

LLM助力突破尘封60年数学猜想!北大王立威团队大幅刷新斯坦纳比下界

近期,LLM 已经在 IMO 上取得了很好的成绩,在一些研究级数学上(如短程证明、组合构造)也有所进展。但如果真正让 LLM 去处理提出数十年的数学猜想,结果会是如何?

来自主题: AI技术研报
5724 点击    2026-05-18 15:29
信通院&清华提出FedRE:用「纠缠」搞定联邦学习三难困境 | CVPR 26

信通院&清华提出FedRE:用「纠缠」搞定联邦学习三难困境 | CVPR 26

信通院&清华提出FedRE:用「纠缠」搞定联邦学习三难困境 | CVPR 26

在联邦学习中,如何同时兼顾模型性能、数据隐私和通信开销,是一个亟需解决的挑战。

来自主题: AI技术研报
10199 点击    2026-05-18 15:29
ICML 2026 | 华为GTS提出AI训练数据新方法,Amazon/Google作者团队「光速跟进」:难度自适应训练正在成为新范式

ICML 2026 | 华为GTS提出AI训练数据新方法,Amazon/Google作者团队「光速跟进」:难度自适应训练正在成为新范式

ICML 2026 | 华为GTS提出AI训练数据新方法,Amazon/Google作者团队「光速跟进」:难度自适应训练正在成为新范式

在大模型后训练中,数据不再只是 “越多越好”,而是要像人类学习一样,动态选择最合适难度的样本。华为提出的 EDCO 方法,将样本难度估计与动态课程编排引入领域大模型微调;数月后,由 Rutgers、Amazon、Google 等作者参与的 DARE 论文即引用 EDCO,并将其作为难度感知强化学习训练的重要对比基线。

来自主题: AI技术研报
5730 点击    2026-05-18 15:29
DAG革新时间序列预测,代码、数据、排行榜全开源 | ICML'26

DAG革新时间序列预测,代码、数据、排行榜全开源 | ICML'26

DAG革新时间序列预测,代码、数据、排行榜全开源 | ICML'26

DAG框架利用时间与通道双重相关网络,有效整合历史与未来外生变量信息,提升时间序列预测准确性。通过发现并注入相关关系,充分利用未来协变量,显著优于现有方法。

来自主题: AI技术研报
7265 点击    2026-05-18 15:28
ICML 2026 |让大模型边想边说:这篇文章把「何时开口」变成可学习策略

ICML 2026 |让大模型边想边说:这篇文章把「何时开口」变成可学习策略

ICML 2026 |让大模型边想边说:这篇文章把「何时开口」变成可学习策略

用过推理型大模型的人,大概率都熟悉这种体验:模型似乎在认真思考,但屏幕上长时间没有真正有用的内容;如果让它一开始就输出,又很容易出现仓促判断,后面的推理还要被早期错误牵着走。

来自主题: AI技术研报
9965 点击    2026-05-18 15:27