AI资讯新闻榜单内容搜索-AIME

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: AIME

野生DeepSeek火了，速度碾压官方版，权重开源

野生DeepSeek火了，速度碾压官方版，权重开源

野生DeepSeek火了，速度碾压官方版，权重开源

没等来 DeepSeek 官方的 R2，却迎来了一个速度更快、性能不弱于 R1 的「野生」变体！这两天，一个名为「DeepSeek R1T2」的模型火了！这个模型的速度比 R1-0528 快 200%，比 R1 快 20%。除了速度上的显著优势，它在 GPQA Diamond（专家级推理能力问答基准）和 AIME 24（数学推理基准）上的表现均优于 R1，但未达到 R1-0528 的水平。

来自主题: AI资讯

9762 点击 2025-07-04 22:18

10行代码，AIME24/25提高15%！揭秘大模型强化学习熵机制

10行代码，AIME24/25提高15%！揭秘大模型强化学习熵机制

10行代码，AIME24/25提高15%！揭秘大模型强化学习熵机制

Nature never undertakes any change unless her interests are served by an increase in entropy. 自然界的任何变化，唯有在熵增符合其利益时方会发生——Max Planck

来自主题: AI技术研报

6631 点击 2025-06-06 12:08

睡觉也在卷！伯克利Letta新作「睡眠时计算」让推理效率飙升

睡觉也在卷！伯克利Letta新作「睡眠时计算」让推理效率飙升

睡觉也在卷！伯克利Letta新作「睡眠时计算」让推理效率飙升

AI也会偷偷努力了？Letta和UC伯克利的研究者提出「睡眠时计算」技术，能让LLM在空闲时间提前思考，大幅提升推理效率。

来自主题: AI技术研报

8158 点击 2025-05-03 15:51

只要9美元！LoRA+强化学习，DeepSeek 1.5B推理性能暴涨20%

只要9美元！LoRA+强化学习，DeepSeek 1.5B推理性能暴涨20%

只要9美元！LoRA+强化学习，DeepSeek 1.5B推理性能暴涨20%

南加州大学团队只用9美元，就能在数学基准测试AIME 24上实现超过20%的推理性能提升，效果好得离谱！而其核心技术只需LoRA+强化学习，用极简路径实现超高性价比后训练。

来自主题: AI技术研报

9297 点击 2025-05-02 19:57

DeepSeek新数学模型刷爆记录！7B小模型自主发现671B模型不会的新技能

DeepSeek新数学模型刷爆记录！7B小模型自主发现671B模型不会的新技能

DeepSeek新数学模型刷爆记录！7B小模型自主发现671B模型不会的新技能

DeepSeek放大招！新模型专注数学定理证明，大幅刷新多项高难基准测试。在普特南测试上，新模型DeepSeek-Prover-V2直接把记录刷新到49道。目前的第一名在657道题中只做出10道题，为Kimi与AIME2024冠军团队Numina合作成果Kimina-Prover。

来自主题: AI技术研报

10177 点击 2025-05-01 22:52

AI能自主出“竞赛题”了！港大&蚂蚁让大模型学会生成难题，水平已接近AIME

AI能自主出“竞赛题”了！港大&蚂蚁让大模型学会生成难题，水平已接近AIME

AI能自主出“竞赛题”了！港大&蚂蚁让大模型学会生成难题，水平已接近AIME

大模型架构研究进展太快，数据却快要不够用了，其中问题数据又尤其缺乏。

来自主题: AI技术研报

9313 点击 2025-03-15 15:39

简单示例提升DeepSeek-R1美国数学邀请赛AIME分数：以步骤为粒度对齐上下文学习与推理

简单示例提升DeepSeek-R1美国数学邀请赛AIME分数：以步骤为粒度对齐上下文学习与推理

简单示例提升DeepSeek-R1美国数学邀请赛AIME分数：以步骤为粒度对齐上下文学习与推理

仅需简单提示，满血版DeepSeek-R1美国数学邀请赛AIME分数再提高。

来自主题: AI技术研报

7205 点击 2025-02-20 14:25

o3-mini数学推理暴打DeepSeek-R1？AIME 2025初赛曝数据集污染大瓜

o3-mini数学推理暴打DeepSeek-R1？AIME 2025初赛曝数据集污染大瓜

o3-mini数学推理暴打DeepSeek-R1？AIME 2025初赛曝数据集污染大瓜

就在刚刚，AIME 2025 I数学竞赛的大模型参赛结果出炉，o3-mini取得78%的最好成绩，DeepSeek R1拿到了65%，取得第四名。然而一位教授却发现，某些1.5B小模型竟也能拿到50%，莫非真的存在数据集污染？

来自主题: AI资讯

10163 点击 2025-02-10 11:21

上一页当前第2页,共2页下一页