AI资讯新闻榜单内容搜索-模型

深度｜如何最大化 GPU 利用效率，让 ROI 最大化？

前不久在人工智能的帮助下，两位科学家获得了诺贝尔物理学奖。可以说人工智能已经在很多领域被广泛应用了。随着大语言模型（LLM）和深度学习的广泛应用，GPU 也已成为机器学习工程师和研究人员最重要的计算资源之一。

来自主题: AI资讯

9157 点击 2024-10-21 14:14

比传统MoE推理速度更快、性能更高的新一代架构，来了！这个通用架构叫做MoE++，由颜水成领衔的昆仑万维2050研究院与北大袁粒团队联合提出。

来自主题: AI技术研报

6032 点击 2024-10-21 11:22

内存占用小，训练表现也要好……大模型训练成功实现二者兼得。来自北理、北大和港中文MMLab的研究团队提出了一种满足低秩约束的大模型全秩训练框架——Fira，成功打破了传统低秩方法中内存占用与训练表现的“非此即彼”僵局。

来自主题: AI技术研报

5450 点击 2024-10-21 10:58

简单高效的大模型检索增强系统LightRAG，香港大学黄超团队最新研究成果。开源两周时间在GitHub上获得将近5k标星，并登上趋势榜。

来自主题: AI技术研报

6329 点击 2024-10-21 10:23

能拿下数学奥赛银牌水平的AI是否达到了12岁陶哲轩的水平？陶神本人的回答来了

来自主题: AI技术研报

4782 点击 2024-10-21 09:53

Indeed Hiring Lab 评估了OpenAI开发的生成式AI模型GPT-4在超过2800项工作技能中的表现。

来自主题: AI技术研报

5373 点击 2024-10-21 09:45

来自主题: AI技术研报

6603 点击 2024-10-20 17:34

2022年诞生的ChatGPT，已经在相当程度上实现了大模型的Scaling law（尺度定律）和通用能力涌现。

来自主题: AI资讯

4911 点击 2024-10-20 17:28

近日，来自谷歌和苹果的研究表明：AI模型掌握的知识比表现出来的要多得多！这些真实性信息集中在特定的token中，利用这一属性可以显著提高检测LLM错误输出的能力。

来自主题: AI技术研报

4590 点击 2024-10-20 17:16

LLM训练速度还可以再飙升20倍！英伟达团队祭出全新架构归一化Transformer（nGPT），上下文越长，训练速度越快，还能维持原有精度。

来自主题: AI技术研报

5779 点击 2024-10-20 17:11