AI资讯新闻榜单内容搜索-Ash

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Ash
FlashAttention-4正式发布:算法流水线大改,矩阵乘法级速度

FlashAttention-4正式发布:算法流水线大改,矩阵乘法级速度

FlashAttention-4正式发布:算法流水线大改,矩阵乘法级速度

近日,深度学习领域重要底层优化技术 FlashAttention 迎来大版本更新。FlashAttention 核心作者、普林斯顿大学助理教授 Tri Dao 表示,在 Blackwell GPU 上,即使瓶颈截然不同,注意力机制的执行速度现在也几乎与矩阵乘法一样快了!

来自主题: AI技术研报
10330 点击    2026-03-06 15:30
谷歌、OpenAI同日发布模型,一个最快最具性价比,一个主打「人情味」

谷歌、OpenAI同日发布模型,一个最快最具性价比,一个主打「人情味」

谷歌、OpenAI同日发布模型,一个最快最具性价比,一个主打「人情味」

深夜,两大科技巨头谷歌和 OpenAI 硬刚起来,相继推出了新版本大模型,分别是 Gemini 3.1 Flash-Lite、GPT‑5.3 Instant。

来自主题: AI资讯
6610 点击    2026-03-04 14:37
为什么BF16的FlashAttention会把训练「炸掉」?清华首次给出机制解释,用极简改动稳住训练

为什么BF16的FlashAttention会把训练「炸掉」?清华首次给出机制解释,用极简改动稳住训练

为什么BF16的FlashAttention会把训练「炸掉」?清华首次给出机制解释,用极简改动稳住训练

一句话总结:社区里困扰了多年的一个 “玄学” 现象终于被拆解清楚了:在 BF16 等低精度训练里,FlashAttention 不是随机出 bug,而是会在特定条件下触发有方向的数值偏置,借助注意力中涌现的相似低秩更新方向被持续放大,最终把权重谱范数和激活推到失控,导致 loss 突然爆炸。论文还给出一个几乎不改模型、只在 safe softmax 里做的极小修改,实测能显著稳定训练。

来自主题: AI技术研报
6902 点击    2026-03-04 13:49
OpenClaw杀出中国黑马,全球开发者狂呼真香!一场深夜AMA撕开底牌

OpenClaw杀出中国黑马,全球开发者狂呼真香!一场深夜AMA撕开底牌

OpenClaw杀出中国黑马,全球开发者狂呼真香!一场深夜AMA撕开底牌

OpenClaw爆火,AI正式步入Agent时代。一支低调的中国团队凭借极速推理、完美适配128G内存的196B模型,直击痛点,强势登顶海外热榜。

来自主题: AI资讯
9194 点击    2026-02-28 19:50
谷歌深夜突发Nano Banana 2,生图圈天塌了!Pro级4K大片,价格砍半

谷歌深夜突发Nano Banana 2,生图圈天塌了!Pro级4K大片,价格砍半

谷歌深夜突发Nano Banana 2,生图圈天塌了!Pro级4K大片,价格砍半

一周一更,谷歌又在深夜扔出「深水炸弹」。就在刚刚,最强生图模型Nano Banana 2横空出世,背靠全新Gemini 3.1 Flash Image。 它不仅生成速度飞快,多语言文字处理更强,还能实时联网,一次直出4K大片。

来自主题: AI资讯
9993 点击    2026-02-27 10:07
Nano Banana 2,泄露!

Nano Banana 2,泄露!

Nano Banana 2,泄露!

过去48小时,Nano Banana 2成为AI开发者圈的热议话题。在海外社交平台X上,关于谷歌这款最新图片生成模型(又名Gemini 3.1 Flash Image预览版)将发布的帖子层出不穷,4K图片四处流传,各种猜测也甚嚣尘上。

来自主题: AI资讯
9621 点击    2026-02-25 21:41
单个LLM已不够?华盛顿大学开源多模型协同框架MoCo

单个LLM已不够?华盛顿大学开源多模型协同框架MoCo

单个LLM已不够?华盛顿大学开源多模型协同框架MoCo

为了支持多模型协同研究并加速这一未来愿景的实现,华盛顿大学 (University of Washington) 冯尚彬团队联合斯坦福大学、哈佛大学等研究人员提出 MoCo—— 一个针对多模型协同研究的 Python 框架。MoCo 支持 26 种在不同层级实现多模型交互的算法,研究者可以灵活自定义数据集、模型以及硬件配置,比较不同算法,优化自身算法,以此构建组合式人工智能系统。MoCo 为设计、

来自主题: AI技术研报
9606 点击    2026-02-18 13:24