AI资讯新闻榜单内容搜索-2

国运级的创新？从 DeepSeek-V3 到 R1 的架构创新与误传的万字长文分析

DeepSeek 的最新模型 DeepSeek-V3 和 DeepSeek-R1 都属于 MoE（混合专家）架构，并在开源世界产生了较大的影响力。特别是 2025 年 1 月开源的 DeepSeek-R1，模型性能可挑战 OpenAI 闭源的 o1 模型。

来自主题: AI资讯

12116 点击 2025-02-09 22:14

DeepSeek-R1推理本地跑，7GB GPU体验啊哈时刻？GRPO内存暴降，GitHub超2万星

黑科技来了！开源LLM微调神器Unsloth近期更新，将GRPO训练的内存使用减少了80%！只需7GB VRAM，本地就能体验AI「啊哈时刻」。

来自主题: AI资讯

10281 点击 2025-02-09 21:29

终于！小米首款AI眼镜来了，“百镜大战”高潮将至？

2月6日有网友发文表示，小米眼镜官微上线，预示着小米AI眼镜即将到来。随后小米公关部总经理王化辟谣，小米眼镜官微多年前就已注册，并非最近上线。

来自主题: AI资讯

9083 点击 2025-02-09 09:20

“我劝过梁文锋很多次，DeepSeek要融资”

爆火的DeepSeek，足以载入史册。很多年后人们回想起这一刻，结论或许是从2022年底OpenAI发布ChaGPT，中国AI发展的主流叙事始终是“追赶”，而DeepSeek横空出世，将“追赶“变成了“创新”和“普及”，甚至是“重塑”和“超越”。

来自主题: AI资讯

8831 点击 2025-02-08 22:09

昆仑万维旗下天工AI正式上线DeepSeek R1+联网搜索

2月8日，昆仑万维旗下「天工AI」正式推出PC版重大更新——上线“DeepSeek R1 + 联网搜索”功能。这一全新升级，不仅解决了用户长期以来关注的DeepSeek联网功能无法使用的问题，还优化了R1版本偶尔崩溃的困扰，为用户带来更加稳定、高效、智能的AI体验。

来自主题: AI资讯

9369 点击 2025-02-08 17:20

a16z：2025年AI语音智能体（AI Voice Agents）该怎么投？

语音是人工智能应用公司最重大的突破之一。作为人类最常用、信息密度最高的交流方式，语音如今在人工智能的推动下首次实现了“可编程化”。

来自主题: AI资讯

7154 点击 2025-02-08 15:50

朱啸虎态度180度大反转，大喊“我肯定会投deepseek“！

“我肯定会投啊！我肯定会投！——这个价格已经不太重要了，关键是参与在这里面。”1年前，2024年初，在我们关于《朱啸虎讲了一个中国现实主义AIGC故事》的报道中，朱啸虎的观点淋漓尽致地展现了一个现实版中国AI故事。他用“我们一看就知道，这个肯定没戏”，“我们一开始就说了，我就不看好大模型”，“ 我都不愿意去聊，你知道吗？这没有意义”，表态绝不会投资6家中国大模型创业公司中的任何一家。

来自主题: AI资讯

10192 点击 2025-02-08 14:38

Ilya公司开放融资：估值200亿美元，0用户0收入

Ilya Sutskever，带着新消息又出现了——创办的公司SSI（Safe SuperIntelligence），正在进行新一轮融资洽谈。目标：估值至少200亿美元。

来自主题: AI资讯

9600 点击 2025-02-08 14:10

谷歌AI解决IMO中84%的几何问题，o1一道没做对！Nature：AI已超过金牌得主平均水平

谷歌DeepMind最新数学AI，一举解决了2000-2024年IMO竞赛中84%的几何问题。AlphaGeometry2论文发布，在总共50道题中完成了42道，相比去年的一代多完成了15道。

来自主题: AI技术研报

8501 点击 2025-02-08 13:55

浙大&通义全面评测智能体复杂任务规划能力，18主流大模型全不及格｜ICLR2025

在处理这类复杂任务的过程中，大模型智能体将问题分解为可执行的工作流（Workflow）是关键的一步。然而，这一核心能力目前缺乏完善的评测基准。为解决上述问题，浙大通义联合发布WorfBench——一个涵盖多场景和复杂图结构工作流的统一基准，以及WorfEval——一套系统性评估协议，通过子序列和子图匹配算法精准量化大模型生成工作流的能力。

来自主题: AI技术研报

8952 点击 2025-02-08 13:19