AI资讯新闻榜单内容搜索-io

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: io
为什么BF16的FlashAttention会把训练「炸掉」?清华首次给出机制解释,用极简改动稳住训练

为什么BF16的FlashAttention会把训练「炸掉」?清华首次给出机制解释,用极简改动稳住训练

为什么BF16的FlashAttention会把训练「炸掉」?清华首次给出机制解释,用极简改动稳住训练

一句话总结:社区里困扰了多年的一个 “玄学” 现象终于被拆解清楚了:在 BF16 等低精度训练里,FlashAttention 不是随机出 bug,而是会在特定条件下触发有方向的数值偏置,借助注意力中涌现的相似低秩更新方向被持续放大,最终把权重谱范数和激活推到失控,导致 loss 突然爆炸。论文还给出一个几乎不改模型、只在 safe softmax 里做的极小修改,实测能显著稳定训练。

来自主题: AI技术研报
6343 点击    2026-03-04 13:49
独家|Vattention 获数百万美元投资:从非线性到指数剪辑,定义视频编辑3.0时代

独家|Vattention 获数百万美元投资:从非线性到指数剪辑,定义视频编辑3.0时代

独家|Vattention 获数百万美元投资:从非线性到指数剪辑,定义视频编辑3.0时代

据悉,专注视频后期 AI Agent 的 Vattention(时空注力)已完成数百万美元种子轮融资,由青锐资本、百度风投、常垒资本联合投资。该公司由计算机科班出身、曾任阿里淘系核心产品总监、沉浸专业视频制作领域多年的连续创业者钟超(花名 船长)创立。本轮融资将主要用于核心团队组建与技术研发,推动其三大核心引擎(MACE、ACE、PACE)的产品化落地。

来自主题: AI资讯
9254 点击    2026-03-02 15:05
ICLR 2026|在「想象」中进化的机器人:港科大×字节跳动Seed提出WMPO,在世界模型中进行VLA强化学习

ICLR 2026|在「想象」中进化的机器人:港科大×字节跳动Seed提出WMPO,在世界模型中进行VLA强化学习

ICLR 2026|在「想象」中进化的机器人:港科大×字节跳动Seed提出WMPO,在世界模型中进行VLA强化学习

香港科技大学 PEI-Lab 与字节跳动 Seed 团队近期提出的 WMPO(World Model-based Policy Optimization),正是这样一种让具身智能在 “想象中训练” 的新范式。该方法无需在真实机器人上进行大规模强化学习交互,却能显著提升策略性能,甚至涌现出 自我纠错(Self-correction) 行为。

来自主题: AI技术研报
8521 点击    2026-03-02 14:31
西湖大学破解Rectified Flow反演不稳定难题,实现零成本稳定增强|ICLR'26

西湖大学破解Rectified Flow反演不稳定难题,实现零成本稳定增强|ICLR'26

西湖大学破解Rectified Flow反演不稳定难题,实现零成本稳定增强|ICLR'26

现有Rectified Flow(RF)模型在反演阶段面临的核心挑战,是逆向ODE对微小误差高度敏感,容易沿着数值不稳定方向偏离前向流形,导致轨迹发散、重建不一致、编辑不可控。为解决这一问题,团队提出PMI(Prox-Mean-Inversion),一种针对RF反演稳定性的轻量化修正机制。

来自主题: AI技术研报
8712 点击    2026-03-02 09:59
Claude被特朗普封杀24小时登顶App Store,CEO含泪首发声!

Claude被特朗普封杀24小时登顶App Store,CEO含泪首发声!

Claude被特朗普封杀24小时登顶App Store,CEO含泪首发声!

全面封杀24小时,Claude一度冲上美国App Store免费榜一。甚至,全网掀起了「抵制ChatGPT」的运动。就在今天,Dario Amodei首度露面发声,眼里都写满了疲惫。

来自主题: AI资讯
8616 点击    2026-03-01 11:30
硅谷全面“龙虾化”!Anthropic微软Meta和Notion等集体交卷自己的Claw

硅谷全面“龙虾化”!Anthropic微软Meta和Notion等集体交卷自己的Claw

硅谷全面“龙虾化”!Anthropic微软Meta和Notion等集体交卷自己的Claw

现在硅谷最火的词,绝对是Claw。就在过去的半个月里,全球AI巨头似乎集体接到了一份名为“做自己的OpenClaw”的剧本。Meta急了。

来自主题: AI资讯
7515 点击    2026-03-01 11:28
GRASP Lab | VPP-TC: 基于可行性理论的被动力矩安全控制框架

GRASP Lab | VPP-TC: 基于可行性理论的被动力矩安全控制框架

GRASP Lab | VPP-TC: 基于可行性理论的被动力矩安全控制框架

本篇文章被 ICRA 2026 接收并获得 IROS 2025 双料 Workshop 最佳论文,第一作者张子哲(site: zizhe.io)是宾夕法尼亚大学机器人学硕士生,同时在 GRASP 实验室担任科研助理,导师为 Nadia Figueroa 教授,研究兴趣涵盖机器学习,安全控制以及人机交互。

来自主题: AI技术研报
9329 点击    2026-03-01 11:18
最长连续工作40天!硅谷Agent又进化了:给个指令,剩下它全搞定

最长连续工作40天!硅谷Agent又进化了:给个指令,剩下它全搞定

最长连续工作40天!硅谷Agent又进化了:给个指令,剩下它全搞定

可自主规划连续执行40天的全自动智能体来了! Factory最新上线的Missions,直接超越OpenClaw,把一盘剥好的肉端上桌——不整虚的!只需一个任务指令,就能交付全自动工程闭环。

来自主题: AI资讯
8067 点击    2026-02-28 15:29
4000万美元!红杉美国和NEA抢投AI医疗公司Anterior

4000万美元!红杉美国和NEA抢投AI医疗公司Anterior

4000万美元!红杉美国和NEA抢投AI医疗公司Anterior

Anterior,刚刚完成了 4000 万美元的融资,使其总融资额达到 6400 万美元。这轮融资由 NEA 和 Sequoia Capital 继续参与,新投资者包括 FPV 和 Kinnevik。但让我真正感兴趣的不是融资金额本身,而是他们正在解决的问题以及他们解决问题的方式。

来自主题: AI资讯
8767 点击    2026-02-27 12:02