AI资讯新闻榜单内容搜索-推理模型

首个OpenAI免费推理模型o3-mini发布！DeepSeek让奥特曼反思：不开源我们错了

就在刚刚，OpenAI深夜紧急发布了最新推理模型，o3-mini系列。一共包含三个版本：low、medium和high。其中o3-mini和o3-mini-high已经上线：

来自主题: AI资讯

11287 点击 2025-02-01 12:39

AI“硬控”拜年

这个春节，国产AI引发全球轰动，一家叫做DeepSeek的初创科技公司发布了一款推理模型，不仅能力不输OpenAI的o1，训练成本也远低于国外，各行各业更是跟风尝试。1月27日，DeepSeek超过ChatGPT，成为苹果商店美国区免费应用榜单第一，也登顶中国区免费榜，由于用户突然涌入太多，还出现了短暂宕机。

来自主题: AI资讯

8417 点击 2025-01-30 12:46

超全推理语言模型蓝图来了！揭开o1、o3、DeepSeek-V3神秘面纱

ETH Zurich等机构提出了推理语言模型（RLM）蓝图，超越LLM局限，更接近AGI，有望人人可用o3这类强推理模型。

来自主题: AI技术研报

8366 点击 2025-01-28 12:20

AI 2025！8大热门赛道开年前瞻，从AI眼镜到推理Scaling一网打尽

明天就是辞旧迎新的春节假期，咱来点不一样的——送上一份「年初展望」，站在2025年伊始，把AI科技领域不同领域的热点趋势，浅浅盘了一圈。从人型机器人、AI眼镜，从推理模型到AI Coding……分别从产品侧和技术侧，把今年最有料的8个大热门趋势一网打尽，干货过年。

来自主题: AI资讯

7553 点击 2025-01-27 14:13

闲来无事，我测了测国产大模型的RAG能力

最近，AI界被推理模型刷屏了。国内各家的推理模型，在新年到来之际不断刷新我们的认知。不过，当我们在实际应用中考量大模型，衡量好不好用的标准，就绝不仅仅局限于其性能和规模了。

来自主题: AI资讯

7502 点击 2025-01-27 13:49

推理模型规划任务成功率从5%到95%，DeepMind遗传算法新研究火了

瞄准推理时扩展（Inference-time scaling），DeepMind新的进化搜索策略火了！所提出的“Mind Evolution”（思维进化），能够优化大语言模型（LLMs）在规划和推理中的响应。

来自主题: AI技术研报

9887 点击 2025-01-24 15:05

选择/杂交/突变，DeepMind将自然选择引入LLM思维，实现心智进化

今天是个好日子，DeepSeek 与 Kimi 都更新了最新版的推理模型，吸引了广泛关注。与此同时，谷歌 DeepMind、加州大学圣地亚哥分校、阿尔伯塔大学的一篇新的研究论文也吸引了不少眼球，并直接冲上了 Hugging Face 每日论文榜第一（1 月 20 日）。

来自主题: AI技术研报

8105 点击 2025-01-23 10:58

1M长上下文，满血版Gemini 2.0又一次登上Chatbot Arena榜首

就在国内各家大模型厂商趁年底疯狂卷的时候，太平洋的另一端也没闲着。就在今天，谷歌发布了 Gemini 2.0 Flash Thinking 推理模型的加强版，并再次登顶 Chatbot Arena 排行榜。

来自主题: AI资讯

10859 点击 2025-01-22 18:40

人大清华提出自主搜索版「Search-o1」！解决知识困境，大幅提升推理模型可靠性

人大清华团队提出Search-o1框架，大幅提升推理模型可靠性。尤其是「文档内推理」模块有效融合了知识学习与推理过程，在「搜索+学习」范式基础上，使得模型的推理表现与可靠性都更上一层楼。

来自主题: AI技术研报

7702 点击 2025-01-22 10:28

Search版o1：推理过程会主动查资料，整体性能优于人类专家，清华人大出品

一个新框架，让Qwen版o1成绩暴涨：在博士级别的科学问答、数学、代码能力的11项评测中，能力显著提升，拿下10个第一！这就是人大、清华联手推出的最新「Agentic搜索增强推理模型框架」Search-o1的特别之处。

来自主题: AI技术研报

8078 点击 2025-01-18 15:00