7B小模型超越DeepSeek-R1:模仿人类教师,弱模型也能教出强推理LLM | Transformer作者团队
7B小模型超越DeepSeek-R1:模仿人类教师,弱模型也能教出强推理LLM | Transformer作者团队Thinking模式当道,教师模型也该学会“启发式”教学了—— 由Transformer作者之一Llion Jones创立的明星AI公司Sakana AI,带着他们的新方法来了!
Thinking模式当道,教师模型也该学会“启发式”教学了—— 由Transformer作者之一Llion Jones创立的明星AI公司Sakana AI,带着他们的新方法来了!
大模型驱动的 AI 智能体(Agent)架构最近讨论的很激烈,其中一个关键争议点在于: 多智能体到底该不该建?
AI生物学数据,又迎来重磅里程碑!
在5月22日凌晨,OpenAI宣布前苹果传奇设计师Jony Ive将加入OpenAI,领导AI硬件部门。
随着语言模型在强化学习和 agentic 领域的进步,agent 正在从通用领域快速渗透到垂直领域,科学和生物医药这类高价值领域尤其受到关注。
何秋剑离开15年国企影视岗位,自学Stable Diffusion等AI工具创业。从10元图片订单起步,依靠影视基础、创意能力及客户服务,发展为月入数万的AIGC制作总监。
【2025年6月,波士顿】近日,全球下一代AI驱动器官芯片平台创新公司耀速科技(Xellar Biosystems)与国际制药巨头辉瑞(Pfizer)联合发布一项重磅成果:AI深度学习病理图像自动识别系统。
6 月 16 日,腾讯 AI Lab 推出并开源 SongGeneration 音乐生成大模型,专注解决音乐 AIGC 中音质、音乐性与生成速度这三大共性难题
45岁的湾区HR,本来拿着7万美元年薪干得顺风顺水,忽然有一天就被优化了;年薪15万美元的全栈工程师,正帮老板优化AI工具呢,忽然就被AI取代了……亚马逊CEO全员信的曝光,再一次证实硅谷AI裁员潮真来了,Dario Amodei的预言,含金量还在上升。
为此,香港中文大学、字节跳动Seed和斯坦福大学研究团队出手,提出了一种面向同声传译的序贯策略优化框架 (Sequential Policy Optimization for Simultaneous Machine Translation, SeqPO-SiMT)。