AI资讯新闻榜单内容搜索-算法

速递｜Pruna AI开源模型压缩"工具箱"，已完成种子轮融资650万美元

欧洲初创公司 Pruna AI 一直在研究 AI 模型的压缩算法，该公司的优化框架将于周四开源。Pruna AI 在几个月前完成了 650 万美元的种子轮融资。参与此次初创公司投资的包括 EQT Ventures、Daphni、Motier Ventures 以及 Kima Ventures。

来自主题: AI资讯

9553 点击 2025-03-21 14:28

01年实习生被曝负责字节RL核心算法！系字节LLM攻坚小组成员

一个超越DeepSeek GRPO的关键RL算法出现了！这个算法名为DAPO，字节、清华AIR联合实验室SIA Lab出品，现已开源。禹棋赢，01年生，本科毕业于哈工大，直博进入清华AIR，目前博士三年级在读。去年年中，他以研究实习生的身份加入字节首次推出的「Top Seed人才计划」。

来自主题: AI资讯

10484 点击 2025-03-20 23:06

一个算法让LLM创新能力暴增，原来是AI学会了进化

如果你让当今的 LLM 给你生成一个创意时钟设计，使用提示词「a creative time display」，它可能会给出这样的结果：

来自主题: AI技术研报

9696 点击 2025-03-20 16:15

超越DeepSeek GRPO的关键RL算法，字节、清华AIR开源DAPO

DeepSeek 提出的 GRPO 可以极大提升 LLM 的强化学习效率，不过其论文中似乎还缺少一些关键细节，让人难以复现出大规模和工业级的强化学习系统。

来自主题: AI技术研报

7240 点击 2025-03-18 17:14

迁移DeepSeek-R1同款算法，小米让7B模型登顶音频理解推断MMAU榜单

7B小模型+3.8万条训练数据，就能让音频理解和推断评测基准MMAU榜单王座易主？

来自主题: AI技术研报

4852 点击 2025-03-17 10:52

超越DeepSeek-R1关键RL算法GRPO，CMU「元强化微调」新范式登场

大语言模型（LLM）在推理领域的最新成果表明了通过扩展测试时计算来提高推理能力的潜力，比如 OpenAI 的 o1 系列。

来自主题: AI技术研报

8936 点击 2025-03-13 14:41

又一位字节AI大将离职

3月12日，华尔街见闻获悉，原字节跳动AI大将、火山引擎高管骆怡航于近日加入生数科技，担任CEO一职。去年底，字节TikTok算法负责人陈志杰也被曝出离职创业。

来自主题: AI资讯

7642 点击 2025-03-13 11:51

「古董」GPU也能跑DeepSeek同款GRPO！显存只需1/10，上下文爆涨10倍

开源微调神器Unsloth带着黑科技又来了：短短两周后，再次优化DeepSeek-R1同款GRPO训练算法，上下文变长10倍，而显存只需原来的1/10！

来自主题: AI技术研报

6119 点击 2025-03-11 10:42

北京大学彭宇新教授团队开源最新多轮交互式商品检索模型、数据集及评测基准

本文构建了新的多轮组合图像检索数据集和评测基准FashionMT。其特点包括：（1）回溯性：每轮修改文本可能涉及历史参考图像信息（如保留特定属性），要求算法回溯利用多轮历史信息；（2）多样化：FashionMT包含的电商图像数量和类别分别是MT FashionIQ的14倍和30倍，且交互轮次数量接近其27倍，提供了丰富的多模态检索场景。

来自主题: AI技术研报

9343 点击 2025-03-05 08:46

重点收藏！三家众擎机器人核心供应链企业！附辟谣信息

据众擎机器人介绍，众擎机器人SE01自主研发的“动态重心补偿算法”以每秒1000次的姿态微调对抗前倾失控风险；仿生肌肉驱动系统使关节瞬时扭矩高达330N·m；而毫米波雷达与视觉融合感知系统则将落地误差控制在±2cm内。

来自主题: AI资讯

11504 点击 2025-03-04 10:17