原作者带队再次改造xLSTM,7B模型速度最快超Mamba 50%,权重代码全开源
原作者带队再次改造xLSTM,7B模型速度最快超Mamba 50%,权重代码全开源近年来,大型语言模型(LLM)通过大量计算资源在推理阶段取得了解决复杂问题的突破。推理速度已成为 LLM 架构的关键属性,市场对高效快速的 LLM 需求不断增长。
近年来,大型语言模型(LLM)通过大量计算资源在推理阶段取得了解决复杂问题的突破。推理速度已成为 LLM 架构的关键属性,市场对高效快速的 LLM 需求不断增长。
最近在推特上刷到一条视频,特别火爆,彻底把我看呆了。
bolt.new、Cursor 之外,来自瑞典的 Lovable 是最近的一家 AI 编程新秀。
通过收集六名志愿者一周的多模态生活数据,研究人员构建了300小时的第一视角数据集EgoLife,旨在开发一款基于智能眼镜的AI生活助手。项目提出了EgoButler系统,包含EgoGPT和EgoRAG两个模块,分别用于视频理解与长时记忆问答,助力AI深入理解日常生活并提供个性化帮助。
刚刚!代码神器 Cursor 宣布推出全新模型 Claude 3.7 Max!简单来说就是Claude 3.7 的完全体形态抢先体验,号称能力远超以往,专为硬核开发者打造!一句话总结 Claude 3.7 Max: 更强、更快、更贵,专为解决复杂代码难题而生!
传统的App原型设计需要专业的设计技能、复杂的工具操作和大量的时间投入。而现在,借助Cursor+Claude 3.7的组合,一段精心设计的提示词就能完成这一切。
国外一个开发者,只用了3个小时,完全靠AI开发游戏,9天时间就赚了17360美元(折合人民币12.64万)。
Blackwell刚开始大规模发货,科技界已经将目光投向了下一代「Rubin」。英伟达的GTC开发者大会,从昔日9000人到如今被戏称为「AI Woodstock」的25000人狂欢,英伟达早已建立起自己的AI帝国!本周黄仁勋将带来哪些惊喜?Rubin会否再掀性能革命?
近年来,代码评测集数量激增,但质量参差不齐。为规范其开发,香港科技大学联合多所高校研究了过去十年的274个代码评测集,发现诸多问题,如数据重复、测试用例错误、隐私信息未删除等。基于此,他们推出了《代码评测集发展指南55项》(How2Bench),涵盖设计、构建、评测、分析、发布五大阶段,旨在提升代码评测集的质量与可靠性。
3月17日上午,零一万物发布万智企业大模型平台,并宣布全面拥抱DeepSeek。这是继DeepSeek引发行业巨震后,作为大模型六小虎之一的零一万物首次对外发声。李开复明确表示,公司的未来重点方向在于ToB业务。虎嗅获悉,零一万物将在2025年进行战略收缩,并尽快完成战略聚焦,资源向ToB大力倾斜。