AI资讯新闻榜单内容搜索-模型

DeepSeek们越来越聪明，却也越来越不听话了。

在今年，DeepSeek R1火了之后。

来自主题: AI资讯

7016 点击 2025-05-20 10:44

可靠的Agent该用哪个模型，LLM多轮对话中的「迷失」现象 |微软最新

微软最近与Salesforce Research联合发布了一篇名为《Lost in Conversation》的研究，说当前最先进的LLM在多轮对话中表现会大幅下降，平均降幅高达39%。这一现象被称为对话中的"迷失"。文章分析了各大模型（包括Claude 3.7-Sonnet、Deepseek-R1等）在多轮对话中的表现差异，还解析了模型"迷失"的根本原因及有效缓解策略。

来自主题: AI技术研报

9393 点击 2025-05-20 10:16

不用等了！吴恩达MCP课程来了！

MCP 是一种开放的技术协议，旨在标准化大型语言模型（LLM）与外部工具和服务的交互方式。你可以把 MCP 理解成像是一个 AI 世界的通用翻译官，让 AI 模型能够与各种各样的外部工具"对话"。

来自主题: AI资讯

8597 点击 2025-05-20 09:44

颜水成领衔，给AI分段位！超100款多模态模型，无人达到L5

理想中的多模态大模型应该是什么样？十所顶尖高校联合发布General-Level评估框架和General-Bench基准数据集，用五级分类制明确了多模态通才模型的能力标准。当前多模态大语言模型在任务支持、模态覆盖等方面存在不足，且多数通用模型未能超越专家模型，真正的通用人工智能需要实现模态间的协同效应。

来自主题: AI技术研报

10842 点击 2025-05-19 17:08