AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
AI读不懂文档结构?计算所重构Agentic RAG文档推理能力

AI读不懂文档结构?计算所重构Agentic RAG文档推理能力

AI读不懂文档结构?计算所重构Agentic RAG文档推理能力

DeepRead让AI像人一样阅读文档:利用OCR识别章节结构,先精准定位相关段落,再完整读取上下文,避免碎片化检索。实验显示,其长文档问答准确率提升17%,能自动跳过冗余信息,精准提取财报、论文等复杂内容,无需额外知识图谱,轻量高效。

来自主题: AI资讯
8267 点击    2026-03-16 14:26
后训练中的RL已死?MIT新算法挑战传统后训练思维,谢赛宁转发

后训练中的RL已死?MIT新算法挑战传统后训练思维,谢赛宁转发

后训练中的RL已死?MIT新算法挑战传统后训练思维,谢赛宁转发

在当前的 LLM 开发中,后训练阶段通常被视为赋予模型特定能力的关键环节。传统的观点认为,模型必须通过强化学习(如 PPO、GRPO 或 RLHF)和进化策略(ES)等算法,在反复的迭代和梯度优化过程中调整权重,才能在特定任务上达到理想的性能。

来自主题: AI技术研报
5944 点击    2026-03-16 14:26
UniPat AI开源SWE-Vision:五百行代码打造SOTA视觉智能体!

UniPat AI开源SWE-Vision:五百行代码打造SOTA视觉智能体!

UniPat AI开源SWE-Vision:五百行代码打造SOTA视觉智能体!

多模态大模型在代码能力上进步惊人,但在基础视觉任务上却频繁失误。UniPat AI 构建了一个极简的视觉智能体框架 ——SWE-Vision,让模型可以编写并执行 Python 代码来处理和验证自己的视觉判断。在五个主流视觉基准测试中,SWE-Vision 均达到了当前最优水平。

来自主题: AI技术研报
9291 点击    2026-03-16 14:25
别怪你的OpenClaw像个乱挥锤子的外行,面对20万个Skills,它缺的是AgentSkillOS

别怪你的OpenClaw像个乱挥锤子的外行,面对20万个Skills,它缺的是AgentSkillOS

别怪你的OpenClaw像个乱挥锤子的外行,面对20万个Skills,它缺的是AgentSkillOS

自2025年10月Claude正式确立Agent Skills规范以来 ,Agent能力的边界正在被暴涨的脚本仓库迅速拓宽。截至2026年2月末,公开可用的Skills数量已突破28万大关 。回顾过去半年,Skills开发的火力几乎全集中在了“供给侧”,而且绝大多数由分散的第三方开发者维护。

来自主题: AI技术研报
6615 点击    2026-03-16 09:53
养虾实战教程:我用OpenClaw做了个能盯盘,也能深度复盘的投资agent

养虾实战教程:我用OpenClaw做了个能盯盘,也能深度复盘的投资agent

养虾实战教程:我用OpenClaw做了个能盯盘,也能深度复盘的投资agent

先提前预告下,这个项目解决不了不赚钱的问题,但能帮助减少冲动交易,解决信息搜集、分析效率低问题。当然,也有同事吐槽,这是个韭菜RL,大家有选择地参考与批判一下就好。

来自主题: AI技术研报
7161 点击    2026-03-16 09:50
AI下半场的战场,从Agent记忆体正式打响

AI下半场的战场,从Agent记忆体正式打响

AI下半场的战场,从Agent记忆体正式打响

最近,一个叫OpenClaw(小龙虾)的开源项目突然爆火,甚至出现线下排队安装的场面。很多人第一次直观地看到,AI不只是chatbot,而是可以真正“动手”操作电脑、完成复杂任务和个性化工作流的智能体。这意味着AI正在进入下半场,开始走向真实应用,并逐渐进入普通人的日常生活。

来自主题: AI技术研报
8752 点击    2026-03-16 09:50
Karpathy:写了20年代码,现在像作弊

Karpathy:写了20年代码,现在像作弊

Karpathy:写了20年代码,现在像作弊

vibe coding这个词,是一年前Karpathy造的,现在他自己不用了。110次实验,AI Agent自主跑完,全程没碰键盘,顺带还搭了套家庭监控分析系统。Box CEO Levie看完说了一句话:专家不会消失,但专家能做到的事,边界变了。

来自主题: AI资讯
7658 点击    2026-03-16 09:36
复旦北大联合美团LongCat提出TDAR:用“粗思考,细求证”破解Block Diffusion的速度精度悖论

复旦北大联合美团LongCat提出TDAR:用“粗思考,细求证”破解Block Diffusion的速度精度悖论

复旦北大联合美团LongCat提出TDAR:用“粗思考,细求证”破解Block Diffusion的速度精度悖论

近期,复旦大学 NLP 实验室(FDU NLP)、北京大学知识计算实验室(KCL)联合美团 LongCat Team 提出了一种 Block Diffusion 推理模型 Test-Time Scaling 新框架 TDAR,通过引入 “粗思考,细求证” (Think Coarse Critic Fine, TCCF) 范式与有界自适应置信度解码

来自主题: AI技术研报
7246 点击    2026-03-14 08:39
Nature子刊封面:牛津提出首个百万级多模态心脏基础模型CSFM

Nature子刊封面:牛津提出首个百万级多模态心脏基础模型CSFM

Nature子刊封面:牛津提出首个百万级多模态心脏基础模型CSFM

牛津大学团队推出全球首个心脏传感基础模型CSFM,能统一分析智能手环、心电图等多源数据,无论信号来自何处、是否完整,都能精准诊断房颤、预测死亡风险、重构血压波形,甚至用单一脉搏波生成完整心电图。打破了设备壁垒,让偏远地区也能享用顶级心脏监护,推动全球医疗平权。

来自主题: AI技术研报
8742 点击    2026-03-13 10:53