AI资讯新闻榜单内容搜索-开源模型

金融研报数据魔改Yi-34B & DeepSeek 67B 谁更强？ Deepmoney金融大模型魔改方案分享&在线实测

在微调大型模型的过程中，一个常用的策略是“知识蒸馏”，这意味着借助高性能模型，如GPT-4，来优化性能较低的开源模型。这种方法背后隐含的哲学理念与logos中心论相似，把GPT-4等模型视为更接近唯一的逻辑或真理的存在。

来自主题: AI资讯

9390 点击 2024-02-21 16:49

7B开源模型，数学能力超过了千亿规模的GPT-4！它的表现可谓是突破了开源模型的极限，连阿里通义的研究员也感叹缩放定律是不是失效了。

来自主题: AI技术研报

5906 点击 2024-02-08 13:30

OpenAI的GPT商店有开源平替了——来自抱抱脸（Hugging Face）。

来自主题: AI资讯

10042 点击 2024-02-04 14:13

2023 年 12 月，首个开源 MoE 大模型 Mixtral 8×7B 发布，在多种基准测试中，其表现近乎超越了 GPT-3.5 和 LLaMA 2 70B，而推理开销仅相当于 12B 左右的稠密模型。为进一步提升模型性能，稠密 LLM 常由于其参数规模急剧扩张而面临严峻的训练成本。

来自主题: AI技术研报

11529 点击 2024-02-04 13:59

现在，人人都可以利用开源模型，打造量身定制的AI助手了。

来自主题: AI资讯

11245 点击 2024-02-04 13:42

艾伦人工智能研究所等5机构最近公布了史上最全的开源模型「OLMo」，公开了模型的模型权重、完整训练代码、数据集和训练过程，为以后开源社区的工作设立了新的标杆。

来自主题: AI技术研报

8716 点击 2024-02-03 14:45

Mistral-Medium竟然意外泄露？此前仅能通过API获得，性能直逼GPT-4。

来自主题: AI资讯

12334 点击 2024-02-02 11:57

Mixtral 8x7B模型开源后，AI社区再次迎来一大波微调实践。来自Nous Research应用研究小组团队微调出新一代大模型Nous-Hermes 2 Mixtral 8x7B，在主流基准测试中击败了Mixtral Instruct。

来自主题: AI技术研报

9292 点击 2024-01-19 14:25

1月17日，新一代大语言模型书⽣·浦语2.0（InternLM2）正式发布并开源。2种参数规格、3种模型版本，共计6个模型，全部免费可商用。

来自主题: AI资讯

9946 点击 2024-01-18 17:54

从 Llama、Llama 2 到 Mixtral 8x7B，开源模型的性能记录一直在被刷新。由于 Mistral 8x7B 在大多数基准测试中都优于 Llama 2 70B 和 GPT-3.5，因此它也被认为是一种「非常接近 GPT-4」的开源选项。

来自主题: AI技术研报

8196 点击 2024-01-16 14:18