韩松等提出FlashMoBA,比MoBA快7.4倍,序列扩到512K也不会溢出
韩松等提出FlashMoBA,比MoBA快7.4倍,序列扩到512K也不会溢出今年 2 月,月之暗面提出了一种名为 MoBA 的注意力机制,即 Mixture of Block Attention,可以直译为「块注意力混合」。
来自主题: AI技术研报
10935 点击 2025-11-18 15:15
搜索
今年 2 月,月之暗面提出了一种名为 MoBA 的注意力机制,即 Mixture of Block Attention,可以直译为「块注意力混合」。