AI资讯新闻榜单内容搜索-LLM

英伟达开源3400亿巨兽，98%合成数据训出最强开源通用模型！性能对标GPT-4o

刚刚，英伟达全新发布的开源模型Nemotron-4 340B，有可能彻底改变训练LLM的方式！从此，或许各行各业都不再需要昂贵的真实世界数据集了。而且，Nemotron-4 340B直接超越了Mixtral 8x22B、Claude sonnet、Llama3 70B、Qwen 2，甚至可以和GPT-4掰手腕！

来自主题: AI技术研报

6386 点击 2024-06-15 15:58

英伟达开源最强通用模型Nemotron-4 340B

性能超越 Llama-3，主要用于合成数据。

来自主题: AI技术研报

12745 点击 2024-06-15 15:40

万字综述大模型高效推理：无问芯穹与清华、上交最新联合研究全面解析大模型推理优化

近年来，大语言模型（Large Language Models, LLMs）受到学术界和工业界的广泛关注，得益于其在各种语言生成任务上的出色表现，大语言模型推动了各种人工智能应用（例如ChatGPT、Copilot等）的发展。然而，大语言模型的落地应用受到其较大的推理开销的限制，对部署资源、用户体验、经济成本都带来了巨大挑战。

来自主题: AI技术研报

11652 点击 2024-06-14 10:35

OpenAI 6个月赚34亿美元！年化收入直接翻倍，却遭CTO揭底：ChatGPT与免费模型差距不大

过去6个月，OpenAI年化收入翻倍，达到34亿美元，这表明这家ChatGPT开发商的业务正在加速增长。尽管OpenAI在LLM赛道依然遥遥领先，但越来越多性能相近的竞争者的出现，让从业者开始怀疑OpenAI的先发优势是否还能长久维持下去，再加上首席技术官最新的采访发言，似乎暗示OpenAI失去了「护城河」。

来自主题: AI资讯

9096 点击 2024-06-13 20:20