AI资讯新闻榜单内容搜索-R1

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: R1

DeepSeek关键RL算法GRPO，有人从头跑通了，贡献完整代码

DeepSeek关键RL算法GRPO，有人从头跑通了，贡献完整代码

DeepSeek关键RL算法GRPO，有人从头跑通了，贡献完整代码

GRPO（Group Relative Policy Optimization）是 DeepSeek-R1 成功的基础技术之一，我们之前也多次报道过该技术，比如《DeepSeek 用的 GRPO 占用大量内存？有人给出了些破解方法》。

来自主题: AI技术研报

10310 点击 2025-03-02 15:14

DeepSeek R1也会大脑过载？过度思考后性能下降，少琢磨让计算成本直降43％

DeepSeek R1也会大脑过载？过度思考后性能下降，少琢磨让计算成本直降43％

DeepSeek R1也会大脑过载？过度思考后性能下降，少琢磨让计算成本直降43％

原来，大型推理模型（Large Reasoning Model，LRM）像人一样，在「用脑过度」也会崩溃，进而行动能力下降。

来自主题: AI技术研报

8603 点击 2025-03-02 14:04

周末AI大瓜，围绕DeepSeek大消息不断！潞晨科技尤洋发文致歉

周末AI大瓜，围绕DeepSeek大消息不断！潞晨科技尤洋发文致歉

周末AI大瓜，围绕DeepSeek大消息不断！潞晨科技尤洋发文致歉

3月1日，潞晨科技官微发布了两则消息。先是宣布：“尊敬的用户，潞晨云将在一周后停止提供DeepSeek API服务，请尽快用完您的余额。如果没用完，我们全额退款。”后又发布消息：“感谢网友的热心提醒，Colossal-AI此前发布对DeepSeek-R1（671B）模型的LoRA微调，在参数加载过程中因参数名称不匹配的Bug导致Loss异常，已在GitHub线上修复。”

来自主题: AI资讯

10653 点击 2025-03-02 09:34

刚刚，DeepSeek全面开源V3/R1推理系统！成本利润率高达545%

刚刚，DeepSeek全面开源V3/R1推理系统！成本利润率高达545%

刚刚，DeepSeek全面开源V3/R1推理系统！成本利润率高达545%

DeepSeek公开推理系统架构，成本利润率可达545%！明天还有更大惊喜吗？

来自主题: AI资讯

7647 点击 2025-03-01 22:47

DeepSeek效应初现：Grok-3补刀ChatGPT，OpenAI已在ICU?

DeepSeek效应初现：Grok-3补刀ChatGPT，OpenAI已在ICU?

DeepSeek效应初现：Grok-3补刀ChatGPT，OpenAI已在ICU?

DeepSeek和xAI相继用R1和Grok-3证明：预训练Scaling Law不是OpenAI的护城河。将来95%的算力将用在推理，而不是现在的训练和推理各50%。OpenAI前途不明，生死难料！

来自主题: AI资讯

8077 点击 2025-03-01 22:37

飞书多维表格+DeepSeek R1效率神器！1000场直播爆款拆解

飞书多维表格+DeepSeek R1效率神器！1000场直播爆款拆解

飞书多维表格+DeepSeek R1效率神器！1000场直播爆款拆解

DeepSeek开源AI引爆全民应用潮！飞书多维表格成为最佳入门级方案，如今亚朵星球、茶百道等纷纷接入，让团队如虎添翼显著提升效率。

来自主题: AI资讯

11538 点击 2025-03-01 14:08

谷歌发布BIG-Bench超难基准：DeepSeek-R1得分6.8，只有o3-mini超过10分

谷歌发布BIG-Bench超难基准：DeepSeek-R1得分6.8，只有o3-mini超过10分

谷歌发布BIG-Bench超难基准：DeepSeek-R1得分6.8，只有o3-mini超过10分

随着 AI 能力的提升，一个常见的话题便是基准不够用了——一个新出现的基准用不了多久时间就会饱和，比如 Replit CEO Amjad Masad 就预计 2023 年 10 月提出的编程基准 SWE-bench 将在 2027 年饱和。

来自主题: AI技术研报

6451 点击 2025-02-28 14:48

一文详解：DeepSeek 第五天开源的 3FS 文件系统

一文详解：DeepSeek 第五天开源的 3FS 文件系统

一文详解：DeepSeek 第五天开源的 3FS 文件系统

DeepSeek开源周的最后一天，迎来的是支撑其V3/R1模型全生命周期数据访问需求的核心基础设施 — Fire-Flyer File System(3FS) 和构建于其上的Smallpond数据处理框架。

来自主题: AI技术研报

8620 点击 2025-02-28 11:33

DeepSeek第五弹炸裂收官！开源全新并行文件系统，榨干SSD全部带宽

DeepSeek第五弹炸裂收官！开源全新并行文件系统，榨干SSD全部带宽

DeepSeek第五弹炸裂收官！开源全新并行文件系统，榨干SSD全部带宽

DeepSeek开源周，今日正式收官！内容依旧惊喜且重磅，直接公开了V3和R1训练推理过程中用到的文件系统。Fire-Flyer文件系统（简称3FS，第三个F代表File），一种利用现代SSD和RDMA网络的全部带宽的并行文件系统；

来自主题: AI资讯

9940 点击 2025-02-28 10:59

英伟达下场，首次优化DeepSeek-R1！B200性能狂飙25倍，碾压H100

英伟达下场，首次优化DeepSeek-R1！B200性能狂飙25倍，碾压H100

英伟达下场，首次优化DeepSeek-R1！B200性能狂飙25倍，碾压H100

最近，英伟达开源了首个在Blackwell架构上优化的DeepSeek-R1，实现了推理速度提升25倍，和每token成本降低20倍的惊人成果。同时，DeepSeek连续开源多个英伟达GPU优化项目，共同探索模型性能极限。

来自主题: AI技术研报

11944 点击 2025-02-27 16:33

上一页当前第27页,共41页下一页