苹果大模型MM1杀入场:300亿参数、多模态、MoE架构,超半数作者是华人
苹果大模型MM1杀入场:300亿参数、多模态、MoE架构,超半数作者是华人今年以来,苹果显然已经加大了对生成式人工智能(GenAI)的重视和投入。此前在 2024 苹果股东大会上,苹果 CEO 蒂姆・库克表示,今年将在 GenAI 领域实现重大进展。此外,苹果宣布放弃 10 年之久的造车项目之后,一部分造车团队成员也开始转向 GenAI。
搜索
今年以来,苹果显然已经加大了对生成式人工智能(GenAI)的重视和投入。此前在 2024 苹果股东大会上,苹果 CEO 蒂姆・库克表示,今年将在 GenAI 领域实现重大进展。此外,苹果宣布放弃 10 年之久的造车项目之后,一部分造车团队成员也开始转向 GenAI。
2024年3月13日,欧洲议会以523票赞成、46票反对、49票弃权正式批准通过了欧盟《人工智能法案》(EU AI Act),由此走出了完成立法程序最重要的一步。
AI世界的进化快的有点跟不上了。刚刚,全球最强最大AI芯片WSE-3发布,4万亿晶体管5nm工艺制程。更厉害的是,WSE-3打造的单个超算可训出24万亿参数模型,相当于GPT-4/Gemini的十倍大。
3月,国内外模型公司动作频频。国产大模型独角兽“五小虎”之一零一万物也有诸多新动作。
3月14日,AWE2024正式开幕,在逛遍了整个展馆,走过上百个展台后,小雷觉得是时候分享自己的逛展首日感受了。跟小雷一起的雷科技AWE报道团成员均反馈,AWE 2024的人气比前两届更旺,开展首日主场馆更是十分热闹。
迄今,全球超 200 个模型基于来自 OpenBMB 开源社区的 Ultra Series 数据集(面壁 Ultra 对齐数据集)对齐,数据集包括 UltraFeedback 和 UltraChat,共计月均下载量超 100 万。
在GPT-4上线后的一年间,国内获得超5000万投资的大模型相关公司,只有21家。在这21家公司中,诞生了5家大模型独角兽(估值超10亿美金)。
数学问题解决能力一直被视为衡量语言模型智能水平的重要指标。通常只有规模极大的模型或经过大量数学相关预训练的模型才能有机会在数学问题上表现出色。
2024 年,大模型领域的一个趋势越来越清晰:重视优化,面向应用。
今天,芯片初创公司Cerebras Systems推出了全新的Wafer Scale Engine 3,并将其现有的最快 AI 芯片世界纪录加倍。