AI资讯新闻榜单内容搜索-模型

紫东太初开源视觉神经增强方法，即插即用终结多模态幻觉 | ACL 2025

通过“视觉神经增强”机制，直接放大模型中的视觉关键注意力头输出，显著降低模型的幻觉现象。

来自主题: AI技术研报

8652 点击 2025-06-28 11:25

AI 开始「自由玩电脑」了！吉大提出「屏幕探索者」智能体

迈向通用人工智能（AGI）的核心目标之一就是打造能在开放世界中自主探索并持续交互的智能体。随着大语言模型（LLMs）和视觉语言模型（VLMs）的飞速发展，智能体已展现出令人瞩目的跨领域任务泛化能力。

来自主题: AI技术研报

8195 点击 2025-06-28 11:18

不靠Agent，4步修复真Bug！蚂蚁CGM登顶SWE-Bench开源榜

Agentless+开源模型，也能高质量完成仓库级代码修复任务，效果媲美业界 SOTA 。

来自主题: AI技术研报

10047 点击 2025-06-27 16:30

零开销，消除图像幻觉！基于零空间投影挖掘正常样本特征 | CVPR 2025

当前大型视觉语言模型（LVLMs）存在物体幻觉问题，即会生成图像中不存在的物体描述。

来自主题: AI技术研报

10391 点击 2025-06-27 16:26

苹果出手！改进GRPO，让dLLM也能高效强化学习

最近，扩散语言模型（dLLM）有点火。现在，苹果也加入这片新兴的战场了。

来自主题: AI技术研报

9242 点击 2025-06-27 16:21

阿里发布信息检索Agent，可自主上网查资料，GAIA基准超越GPT-4o | 模型&数据开源

Agent能“看懂网页”，像人类一样上网？阿里发布WebDancer，就像它的名字一样，为“网络舞台”而生。

来自主题: AI技术研报

8145 点击 2025-06-27 15:54

AgentAuditor: 让智能体安全评估器的精确度达到人类水平

LLM 智能体（LLM Agent）正从 “纸上谈兵” 的文本生成器，进化为能自主决策、执行复杂任务的 “行动派”。它们可以使用工具、实时与环境互动，向着通用人工智能（AGI）大步迈进。然而，这份 “自主权” 也带来了新的问题：智能体在自主交互中，是否安全？

来自主题: AI技术研报

7681 点击 2025-06-27 15:39

2G 内存跑 Gemma 3n 完整版！全球首个 10B 内模型杀疯 LMArena：1300 分碾压记录

当地时间 6 月 26 日，在上个月的 Google I/O 上首次亮相预览后，谷歌如今正式发布了 Gemma 3n 完整版，可以直接在本地硬件上运行。

来自主题: AI资讯

8485 点击 2025-06-27 15:21

内部爆料，OpenAI 将发布神秘「OS模型」，员工惊掉下巴

刚刚，OpenAI 研究员Aidan McLaughlin的一条推文引爆了网友们的关注。

来自主题: AI资讯

9529 点击 2025-06-27 12:44

Black Forest震撼开源FLUX.1 Kontext [dev]：媲美GPT-4o的图像编辑

前段时间，沉寂了很久的Flux官方团队Black Forest Labs发布了新模型：FLUX.1 Kontext，这是一套支持生成与编辑图像的流匹配（flow matching）模型。FLUX.1 Kontext不仅支持文生图，还实现了上下文图像生成功能，可以同时使用文本和图像作为提示词，并能无缝提取修改视觉元素，生成全新且协调一致的画面。

来自主题: AI技术研报

10434 点击 2025-06-27 12:36