AI资讯新闻榜单内容搜索-模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型
Hermes上线MoA功能!比Opus 4.8和GPT-5.5还猛

Hermes上线MoA功能!比Opus 4.8和GPT-5.5还猛

Hermes上线MoA功能!比Opus 4.8和GPT-5.5还猛

近日,Hermes Agent上线了MoA(Mixture of Agents)功能,支持用户自由组合多种模型作为虚拟模型使用,在Nous Research即将发布的基准测试中,这个混合模型的评分超过了Opus 4.8 和GPT-5.5。

来自主题: AI资讯
9060 点击    2026-07-01 00:22
美团 LongCat-2.0:第一个在纯国产芯片训练的万亿参数大模型

美团 LongCat-2.0:第一个在纯国产芯片训练的万亿参数大模型

美团 LongCat-2.0:第一个在纯国产芯片训练的万亿参数大模型

如果只看标题,它很容易被归到“又一个万亿参数大模型”的队伍里:1.6 万亿总参数、MoE 架构、100 万 token 上下文、面向代码和 Agent 场景。但这次真正值得看的,不只是模型有多大,而是它背后的三个问题:国产算力能不能支撑前沿级大模型训练?

来自主题: AI资讯
9611 点击    2026-06-30 21:04
条条电路通罗马:大模型可解释性的「唯一机制」可能从一开始就不存在

条条电路通罗马:大模型可解释性的「唯一机制」可能从一开始就不存在

条条电路通罗马:大模型可解释性的「唯一机制」可能从一开始就不存在

长期以来,机制可解释性(mechanistic interpretability)领域有一个几乎从未被明说、却被视为理所当然的前提:模型对于同一种任务的能力或表现,背后对应着一条唯一的、或近乎唯一的内部「电路」(circuit)。该领域的研究者们之所以要做「电路发现」(circuit discovery),是为了要把这些「特定的」电路找出来。

来自主题: AI技术研报
7768 点击    2026-06-30 15:12
51天一个新版本!ChatGPT和Claude狂飙,谷歌被甩出代差

51天一个新版本!ChatGPT和Claude狂飙,谷歌被甩出代差

51天一个新版本!ChatGPT和Claude狂飙,谷歌被甩出代差

AI圈彻底进入生死时速!OpenAI和Anthropic极限狂飙,平均51天空降一个新模型,直接把谷歌甩在了身后。

来自主题: AI资讯
6516 点击    2026-06-30 15:11
担心蒸馏问题,Meta限用Claude Code、Codex

担心蒸馏问题,Meta限用Claude Code、Codex

担心蒸馏问题,Meta限用Claude Code、Codex

据外媒 The Information 报道:Meta 正在限制员工在 AI 模型构建中使用 Claude Code 和 Codex,原因是担心涉及模型蒸馏。 Meta 担心这些外部模型生成的内容,可能进入自家的训练数据或评测体系,从而引发所谓的模型蒸馏争议。

来自主题: AI资讯
9315 点击    2026-06-30 12:15
登顶权威榜单!无界动力发布全球首个「长时序双向物理因果链」隐空间世界模型 MWA™

登顶权威榜单!无界动力发布全球首个「长时序双向物理因果链」隐空间世界模型 MWA™

登顶权威榜单!无界动力发布全球首个「长时序双向物理因果链」隐空间世界模型 MWA™

当前,物理 AI 正面临着关于泛化能力的普遍质疑。当模型缺乏对真实物理规律的深度认知、难以跨越复杂多变的开放场景时,如何让机器人真正理解物理世界并精准规划决策,已成为具身智能破局的关键。

来自主题: AI技术研报
7593 点击    2026-06-30 10:48
Claude「断电」背后:中国基准首次捅开了AI万亿市场「死穴」

Claude「断电」背后:中国基准首次捅开了AI万亿市场「死穴」

Claude「断电」背后:中国基准首次捅开了AI万亿市场「死穴」

6月22日Claude全家桶集体宕机,只是冰山一角。当最强大模型被丢进真实机房直面「幽灵故障」,AISHPerf-智算运维智能体评测基准给出残酷答案:全军覆没,无一过50分。这道鸿沟,第一次被量化。

来自主题: AI资讯
6156 点击    2026-06-30 10:21