AI资讯新闻榜单内容搜索-模型

非Transformer架构站起来了！首个纯无注意力大模型，超越开源巨头Llama 3.1

Mamba 架构的大模型又一次向 Transformer 发起了挑战

来自主题: AI资讯

7624 点击 2024-08-13 17:49

T-MAC是一种创新的基于查找表（LUT）的方法，专为在CPU上高效执行低比特大型语言模型（LLMs）推理而设计，无需权重反量化，支持混合精度矩阵乘法（mpGEMM），显著降低了推理开销并提升了计算速度。

来自主题: AI资讯

7521 点击 2024-08-13 17:42

人工智能系统依靠充足、高质量的训练数据来获得高性能，但MIT等机构最近的一项研究发现，曾经免费提供的数据在多个方面变得越来越难获取。

来自主题: AI资讯

8420 点击 2024-08-13 17:36

TII开源全球第一个通用的大型Mamba架构模型Falcon Mamba 7B，性能与Transformer架构模型相媲美，在多个基准测试上的均分超过了Llama 3.1 8B和Mistral 7B。

来自主题: AI资讯

8942 点击 2024-08-13 17:07

只用提示词，多模态大模型就能更懂场景中的人物关系了。

来自主题: AI技术研报

11226 点击 2024-08-13 16:56

ChatGPT有新模型了！

来自主题: AI资讯

10491 点击 2024-08-13 16:52

只是换掉Transformer架构，立马性能全方位提升，问鼎同规模开源模型！

来自主题: AI资讯

8747 点击 2024-08-13 16:47

新一轮的竞争开始了

来自主题: AI资讯

11549 点击 2024-08-13 16:03

拿了巨额融资的月之暗面在变现上还不用那么急迫，但大模型应用落地跑通商业化是投资方检验未来投资成果的关键。

来自主题: AI资讯

9697 点击 2024-08-13 15:39

社交娱乐、教育学习、商务办公是AI用户高频使用场景

来自主题: AI资讯

11821 点击 2024-08-13 15:37