AI资讯新闻榜单内容搜索-LLM

维基百科+大模型打败幻觉！斯坦福WikiChat性能碾压GPT-4，准确率高达97.3%

大模型固有的幻觉问题严重影响了LLM的表现。斯坦福最新研究利用维基百科数据训练大模型，得到的WikiChat成为首个几乎不产生幻觉的聊天机器人。

来自主题: AI资讯

6305 点击 2024-01-03 14:00

骁龙888实时运行，美团、浙大等打造全流程移动端多模态大模型MobileVLM

近日，美团、浙大等推出了能够在移动端部署的多模态大模型，包含了 LLM 基座训练、SFT、VLM 全流程。也许不久的将来，每个人都能方便、快捷、低成本的拥有属于自己的大模型。

来自主题: AI资讯

11415 点击 2024-01-03 13:42

面向超长上下文，大语言模型如何优化架构，这篇综述一网打尽了

作者重点关注了基于 Transformer 的 LLM 模型体系结构在从预训练到推理的所有阶段中优化长上下文能力的进展。

来自主题: AI资讯

5964 点击 2024-01-03 13:38

苹果这篇“魔改”闪存的论文，暴露了它想彻底掌控大模型的野心

大模型领域最新的一个热门趋势是把模型塞到手机里。而最应该做这个研究的公司终于带着它的论文现身，那就是苹果。

来自主题: AI资讯

5807 点击 2024-01-03 10:10

大模型幻觉问题无解？理论证明校准的LM必然会出现幻觉

大型语言模型（LLM）虽然在诸多下游任务上展现出卓越的能力，但其实际应用还存在一些问题。其中，LLM 的「幻觉（hallucination）」问题是一个重要缺陷。

来自主题: AI资讯

9394 点击 2024-01-02 15:31

GPT-5不会真正突破，24年AGI不会实现！全网AI大佬24年最全预测

经过23年的生成式AI之年，24年AI会有哪些新突破？大佬预测，即使GPT-5发布，LLM在本质上仍然有限，在24年，基本的AGI也不足以实现。

来自主题: AI资讯

4951 点击 2024-01-01 23:25

Hugging Face：2023开源LLM大爆发，数据竞赛已开启！

2023年的LLM开源社区都发生了什么？来自Hugging Face的研究员带你回顾并重新认识开源LLM

来自主题: AI资讯

11223 点击 2023-12-31 14:34

挑战Transformer，华为诺亚新架构盘古π来了，已有1B、7B模型

近日，来自华为诺亚方舟实验室、北京大学等机构的研究者提出了盘古 π 的网络架构，尝试来构建更高效的大模型架构。

来自主题: AI资讯

10747 点击 2023-12-30 15:20

从模型、数据和框架三个视角出发，这里有份54页的高效大语言模型综述

大规模语言模型（LLMs）在很多关键任务中展现出显著的能力，比如自然语言理解、语言生成和复杂推理，并对社会产生深远的影响。然而，这些卓越的能力伴随着对庞大训练资源的需求（如下图左）和较长推理时延（如下图右）。因此，研究者们需要开发出有效的技术手段去解决其效率问题。

来自主题: AI技术研报

4996 点击 2023-12-30 15:16

2023年科研领域「科学ChatGPT」有哪些？LLM for Science有哪些探索......

ChatGPT 凭一己之力掀起了 AI 领域的热潮，火爆全球，似乎开启了第四次工业革命。

来自主题: AI技术研报

6527 点击 2023-12-29 16:58

AI资讯新闻榜单内容搜索-LLM

维基百科+大模型打败幻觉！斯坦福WikiChat性能碾压GPT-4，准确率高达97.3%

骁龙888实时运行，美团、浙大等打造全流程移动端多模态大模型MobileVLM

面向超长上下文，大语言模型如何优化架构，这篇综述一网打尽了

苹果这篇“魔改”闪存的论文，暴露了它想彻底掌控大模型的野心

大模型幻觉问题无解？理论证明校准的LM必然会出现幻觉

GPT-5不会真正突破，24年AGI不会实现！全网AI大佬24年最全预测

Hugging Face：2023开源LLM大爆发，数据竞赛已开启！

挑战Transformer，华为诺亚新架构盘古π来了，已有1B、7B模型

从模型、数据和框架三个视角出发，这里有份54页的高效大语言模型综述

2023年科研领域「 科学ChatGPT」有哪些？LLM for Science有哪些探索......

2023年科研领域「科学ChatGPT」有哪些？LLM for Science有哪些探索......