AI资讯新闻榜单内容搜索-Mark

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Mark
ICLR 2026 | 让多模态模型学会主动说话:主动交互从训练到评估的完整方案

ICLR 2026 | 让多模态模型学会主动说话:主动交互从训练到评估的完整方案

ICLR 2026 | 让多模态模型学会主动说话:主动交互从训练到评估的完整方案

本文综合北京大学王选计算机研究所发布的 ProactiveVideoQA 和 MMDuet2 两篇论文,介绍视频多模态大模型如何实现 “主动交互”—— 在视频播放过程中自主决定何时发起回复,而非等待用户提问。ProactiveVideoQA 提出评估指标和 benchmark,MMDuet2 则通过强化学习训练方法实现了 SOTA 性能,无需精确的回复时间标注即可训练出及时、准确的主动交互模型。

来自主题: AI技术研报
8245 点击    2026-03-30 15:02
黑马AI公司UniPat AI横扫预测市场!Echo系统预测未来胜率已超过人类

黑马AI公司UniPat AI横扫预测市场!Echo系统预测未来胜率已超过人类

黑马AI公司UniPat AI横扫预测市场!Echo系统预测未来胜率已超过人类

大模型能否预测未来?UniPat AI构建了一套完整的预测智能基础设施,Echo,包含动态评测引擎、面向未来事件的训练范式和预测专用模型EchoZ-1.0。在其公开的General AI Prediction Leaderboard上,EchoZ-1.0稳居第一,并在与Polymarket人类交易市场的直接对比中展现出显著优势。

来自主题: AI资讯
8978 点击    2026-03-30 11:00
ClawCiv:OpenClaw的电竞排行榜来了

ClawCiv:OpenClaw的电竞排行榜来了

ClawCiv:OpenClaw的电竞排行榜来了

想象一下:你精心调教了两周的 OpenClaw,自信满满地跑了一组 Benchmark——结果发现全球排名 387 位,前面那位用的模型跟你一样,但分数比你高 40%。你想不想知道他到底配了什么 Skill?

来自主题: AI资讯
8517 点击    2026-03-29 13:09
aiX-apply-4B逆袭DeepSeek-V3.2!aiXcoder发布代码变更应用模型,单卡推理提效15倍

aiX-apply-4B逆袭DeepSeek-V3.2!aiXcoder发布代码变更应用模型,单卡推理提效15倍

aiX-apply-4B逆袭DeepSeek-V3.2!aiXcoder发布代码变更应用模型,单卡推理提效15倍

硅心科技(aiXcoder)发布了一款专为「代码变更应用」场景设计的高性能、轻量级模型 aiX-apply-4B。基准测试结果显示,在 20 多种主流编程语言及 Markdown 等多类型文件格式的测试中,aiX-apply-4B 的平均准确率达到 93.8%,超越 Qwen3-4B 基座模型 62.6% 的准确度

来自主题: AI技术研报
8386 点击    2026-03-27 18:21
新「上帝之手」MiroFish,干爆 Polymarket,其实只是个壳?|附全面实测

新「上帝之手」MiroFish,干爆 Polymarket,其实只是个壳?|附全面实测

新「上帝之手」MiroFish,干爆 Polymarket,其实只是个壳?|附全面实测

X 上到处都是各种传奇故事:有人已经用它赚了超过 140 万美元,有人短期内迅速赚了几万美元。这个项目在国内曝光的比较少,但在海外各个社区已经成了现象级项目。这个项目叫:MiroFish。

来自主题: AI产品测评
7856 点击    2026-03-22 09:43
Benchmark 5000万美元押注Gumloop :下一个独角兽是让实习生也能造AI Agent

Benchmark 5000万美元押注Gumloop :下一个独角兽是让实习生也能造AI Agent

Benchmark 5000万美元押注Gumloop :下一个独角兽是让实习生也能造AI Agent

Gumloop 刚刚宣布完成 5000 万美元的 B 轮融资,由 Benchmark 领投,Nexus VP、First Round Capital、Y Combinator、Box Group、The Cannon Project 和 Shopify Ventures 参与跟投。

来自主题: AI资讯
8913 点击    2026-03-21 10:28
CVPR'26 | 以机器人为中心的ToM推理框架,从心智推理到决策行动

CVPR'26 | 以机器人为中心的ToM推理框架,从心智推理到决策行动

CVPR'26 | 以机器人为中心的ToM推理框架,从心智推理到决策行动

吉林大学&微软亚洲研究院等团队提出MindPower框架,让机器人像人一样理解他人想法并主动帮忙,构建了首个以机器人为中心的心智推理评测体系,通过六层推理链条,让AI不仅看懂场景,更能推断意图、做出决策、执行动作,显著提升助人能力。

来自主题: AI技术研报
6222 点击    2026-03-17 08:49
OpenAI开除内鬼!拿着改变世界的机密去赌博,一夜狂赚几十万

OpenAI开除内鬼!拿着改变世界的机密去赌博,一夜狂赚几十万

OpenAI开除内鬼!拿着改变世界的机密去赌博,一夜狂赚几十万

OpenAI刚刚开除了一名员工,原因令人瞠目:此人利用公司核心机密,在Polymarket等预测市场上疯狂下注牟利。更炸裂的是,调查发现这绝非个例——过去一年多,60个神秘钱包做出了77次精准到离谱的「内幕押注」。

来自主题: AI资讯
8103 点击    2026-03-16 10:41
Legora、Mercor 都在用,Reducto 能成为独立的 LLM 数据入口吗?

Legora、Mercor 都在用,Reducto 能成为独立的 LLM 数据入口吗?

Legora、Mercor 都在用,Reducto 能成为独立的 LLM 数据入口吗?

Reducto 在去年 6 个月内接连完成分别由 Benchmark 与 a16z 领投的两轮融资,估值翻了 3 倍,达到 6 亿美元。我们认为,Reducto 切中了 AI 应用走向生产环境过程中的“精确数据摄取”瓶颈。

来自主题: AI资讯
9465 点击    2026-03-14 08:41
卡帕西开源Agent自进化训练框架,5分钟一轮实验,48h内揽星9.5k

卡帕西开源Agent自进化训练框架,5分钟一轮实验,48h内揽星9.5k

卡帕西开源Agent自进化训练框架,5分钟一轮实验,48h内揽星9.5k

大神Karpathy又开源了新项目——一个能够自主进化的AI科研循环系统。这个项目名叫autoresearch,主打让智能体完全自主地搞科研,只要在Markdown文档里写好指令,剩下的流程全都由AI自动完成。

来自主题: AI技术研报
7777 点击    2026-03-09 18:28