无需CUDA代码给H100加速33%-50%,Flash Attention作者新作火了
无需CUDA代码给H100加速33%-50%,Flash Attention作者新作火了无需CUDA代码,给H100加速33%-50%! Flash Attention、Mamba作者之一Tri Dao的新作火了。
来自主题: AI技术研报
10706 点击 2025-07-11 16:06
搜索
无需CUDA代码,给H100加速33%-50%! Flash Attention、Mamba作者之一Tri Dao的新作火了。