AI资讯新闻榜单内容搜索-Transforme

这篇论文非常火！差分Transformer竟能消除注意力噪声，犹如降噪耳机

Transformer 的强大实力已经在诸多大型语言模型（LLM）上得到了证明，但该架构远非完美，也有很多研究者致力于改进这一架构，比如机器之心曾报道过的 Reformer 和 Infini-Transformer。

来自主题: AI技术研报

7450 点击 2024-10-10 12:15

Transformer计算，竟然直接优化到乘法运算了。MIT两位华人学者近期发表的一篇论文提出：Addition is All You Need，让LLM的能耗最高降低95%。

来自主题: AI技术研报

4965 点击 2024-10-08 17:32

自去年以来，文本到图像生成模型取得了巨大进展，模型的架构从传统的基于UNet逐渐转变为基于Transformer的模型。

来自主题: AI资讯

4549 点击 2024-10-07 14:03

通用机器人模型，目前最大的障碍便是「异构性」。

来自主题: AI资讯

5807 点击 2024-10-06 16:26

挑战Transformer，MIT初创团队推出LFM（Liquid Foundation Model）新架构模型爆火。

来自主题: AI技术研报

9980 点击 2024-10-02 11:48

就在刚刚，MIT系初创公司Liquid AI团队官宣：推出首批多模态非Transformer模型——液体基础模型LFM。

来自主题: AI资讯

6654 点击 2024-10-01 14:52

一个受线虫启发的全新架构，三大「杯型」均能实现 SOTA 性能，资源高度受限环境也能部署。移动机器人可能更需要一个虫子的大脑。

来自主题: AI技术研报

9165 点击 2024-10-01 14:10

通往AGI的路径只有一条吗？实则不然。这家国产AI黑马认为，「群体智能」或许是一种最佳的尝试。他们正打破惯性思维，打造出最强AI大脑，要让世界每一台设备都有自己的智能。

来自主题: AI技术研报

10141 点击 2024-09-27 19:19

取代现有计算架构。人工智能（AI）硬件有望彻底被颠覆，在计算速度和能效方面实现前所未有的改进。

来自主题: AI资讯

4885 点击 2024-09-25 16:56

扩展多模态大语言模型（MLLMs）的长上下文能力对于视频理解、高分辨率图像理解以及多模态智能体至关重要。这涉及一系列系统性的优化，包括模型架构、数据构建和训练策略，尤其要解决诸如随着图像增多性能下降以及高计算成本等挑战。

来自主题: AI技术研报

9308 点击 2024-09-21 18:19