AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
首个长程Doc2Repo训练集!代码Agent不止修bug,开始造仓库

首个长程Doc2Repo训练集!代码Agent不止修bug,开始造仓库

首个长程Doc2Repo训练集!代码Agent不止修bug,开始造仓库

DeNovoSWE是一个用于训练代码智能体从零生成完整仓库的数据集,包含4818个真实任务实例。它通过结构化文档和严格验证机制,帮助智能体掌握复杂系统构建能力,而不仅仅是修复代码。这为代码智能体迈向更高阶的软件工程任务提供了关键支持。

来自主题: AI技术研报
9601 点击    2026-06-25 10:04
直接从像素到单词:这个原生大模型统一单图、多图、视频和空间智能

直接从像素到单词:这个原生大模型统一单图、多图、视频和空间智能

直接从像素到单词:这个原生大模型统一单图、多图、视频和空间智能

今天几乎所有主流视觉语言模型(VLM)—— 无论是 Qwen-VL、InternVL,还是 LLaVA 系列 —— 都遵循着同一套经典架构:先用预训练视觉编码器(如 CLIP、SigLIP)将图像压缩为特征,再通过投影层把这些特征送入大语言模型。

来自主题: AI技术研报
7507 点击    2026-06-24 16:06
真机强化学习如何保证安全性?清华团队提出安全探索均衡机制

真机强化学习如何保证安全性?清华团队提出安全探索均衡机制

真机强化学习如何保证安全性?清华团队提出安全探索均衡机制

近日清华大学于IEEE TPAMI发表论文,探讨了真机强化学习的安全性保障问题,提出了一套「安全探索均衡」新型机制,揭示了安全探索的理论最大边界,并攻克了其收敛性证明难题。

来自主题: AI技术研报
6720 点击    2026-06-24 16:03