模型知识蒸馏新SOTA!告别传统散度蒸馏|腾讯优图&中科大出品
模型知识蒸馏新SOTA!告别传统散度蒸馏|腾讯优图&中科大出品用大模型“蒸馏”小模型,有新招了!
来自主题: AI技术研报
8939 点击 2024-12-04 09:34
搜索
用大模型“蒸馏”小模型,有新招了!
实时API将完全改变我们与人工智能互动的方式,定制化AI模型成为主流,并且通过模型蒸馏实现低延迟、低成本、高性能,使AI更易使用、更高质量。
今天,OpenAI 2024年首场DevDay在旧金山2号码头的Gateway Pavilion低调举办。
Emory大学的研究团队提出了一种创新的方法,将大语言模型(LLM)在文本图(Text-Attributed Graph, 缩写为TAG)学习中的强大能力蒸馏到本地模型中,以应对文本图学习中的数据稀缺、隐私保护和成本问题。通过训练一个解释器模型来理解LLM的推理过程,并对学生模型进行对齐优化,在多个数据集上实现了显著的性能提升,平均提高了6.2%。
小模型崛起了。