AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
都在卷「让大模型多循环几遍」,这个7B模型LoopCoder v2说:多循环 1 次就够了

都在卷「让大模型多循环几遍」,这个7B模型LoopCoder v2说:多循环 1 次就够了

都在卷「让大模型多循环几遍」,这个7B模型LoopCoder v2说:多循环 1 次就够了

当所有人都在比谁「想得更久、算得更多」——推理模型动辄输出成千上万个思考 token,循环式架构恨不得在内部反复迭代十遍八遍——一项新研究反手泼了盆冷水:

来自主题: AI技术研报
6519 点击    2026-07-01 10:26
清华发布智能体社会AgentSociety第二代:让社会科学研究真正「跑起来」

清华发布智能体社会AgentSociety第二代:让社会科学研究真正「跑起来」

清华发布智能体社会AgentSociety第二代:让社会科学研究真正「跑起来」

AgentSociety²是清华大学团队推出的社会科学研究新工具,通过AI智能体模拟社会行为,帮助研究者构建实验环境,直接运行社会假设。它让AI同时扮演研究助手和实验参与者角色,使复杂社会问题能被构造、运行和分析,提升研究效率与可复现性。

来自主题: AI技术研报
6317 点击    2026-07-01 09:52
破解遥感目标的形状与尺度难题,PKINet二代推理提速近4倍!

破解遥感目标的形状与尺度难题,PKINet二代推理提速近4倍!

破解遥感目标的形状与尺度难题,PKINet二代推理提速近4倍!

卫星和航空影像里的目标,不仅大小相差悬殊,还可能朝向任意方向:一边是细长的桥梁、船舶,一边是密集的小车和大面积运动场。PKINet-v2是一种改进的遥感目标检测模型,能同时处理复杂形状和尺度变化的问题。

来自主题: AI技术研报
6185 点击    2026-07-01 09:50
美团 LongCat-2.0:第一个在纯国产芯片训练的万亿参数大模型

美团 LongCat-2.0:第一个在纯国产芯片训练的万亿参数大模型

美团 LongCat-2.0:第一个在纯国产芯片训练的万亿参数大模型

如果只看标题,它很容易被归到“又一个万亿参数大模型”的队伍里:1.6 万亿总参数、MoE 架构、100 万 token 上下文、面向代码和 Agent 场景。但这次真正值得看的,不只是模型有多大,而是它背后的三个问题:国产算力能不能支撑前沿级大模型训练?

来自主题: AI资讯
9574 点击    2026-06-30 21:04
条条电路通罗马:大模型可解释性的「唯一机制」可能从一开始就不存在

条条电路通罗马:大模型可解释性的「唯一机制」可能从一开始就不存在

条条电路通罗马:大模型可解释性的「唯一机制」可能从一开始就不存在

长期以来,机制可解释性(mechanistic interpretability)领域有一个几乎从未被明说、却被视为理所当然的前提:模型对于同一种任务的能力或表现,背后对应着一条唯一的、或近乎唯一的内部「电路」(circuit)。该领域的研究者们之所以要做「电路发现」(circuit discovery),是为了要把这些「特定的」电路找出来。

来自主题: AI技术研报
7749 点击    2026-06-30 15:12
给Transformer变个形,LLM竟能变得更聪明

给Transformer变个形,LLM竟能变得更聪明

给Transformer变个形,LLM竟能变得更聪明

2026 年 6 月,大模型行业正在经历一场前所未有的「开源海啸」:英伟达放出了 550B 参数的混合架构模型,谷歌送出多模态的 Gemma 新版本,智谱用最宽松的协议全量开源了自家旗舰模型。

来自主题: AI技术研报
7681 点击    2026-06-30 10:20