AI资讯新闻榜单内容搜索-LLM

为什么要纯C语言手搓GPT-2，Karpathy回应网友质疑

一个仅用 1000 行代码即可在 CPU/fp32 上实现 GPT-2 训练的项目「llm.c」

来自主题: AI资讯

7217 点击 2024-04-11 20:53

大语言模型潜力被激发—— 无需训练大语言模型就能实现高精度时序预测，超越一切传统时序模型。

来自主题: AI资讯

8115 点击 2024-04-11 17:25

大模型在今年的落地，除了对用 AI 对已有业务进行改造和提效外，算力和推理的优化，可能是另外一项重要的实践了。这在腾讯的两个完全不同的业务上有着明显的体现。

来自主题: AI资讯

12435 点击 2024-04-10 21:12

近日，朱泽园 (Meta AI) 和李远志 (MBZUAI) 的最新研究《语言模型物理学 Part 3.3：知识的 Scaling Laws》用海量实验（50,000 条任务，总计 4,200,000 GPU 小时）总结了 12 条定律，为 LLM 在不同条件下的知识容量提供了较为精确的计量方法。

来自主题: AI资讯

6428 点击 2024-04-10 19:11

上个月，彭博社消息称苹果正在与 Google 进行谈判，希望将 Gemini 集成的 iPhone 当中，为 iPhone 的软件提供 AI 相关的新功能。把新系统的核心功能“外包”给第三方，这种做法非常不苹果。

来自主题: AI资讯

7285 点击 2024-04-09 16:47

大语言模型的「逆转诅咒」，被解开了。近日，来自Meta FAIR的研究人员推出了反向训练大法，让模型从反方向上学到了事实之间的逻辑，终于改进了这个困扰人们已久的问题。

来自主题: AI技术研报

6818 点击 2024-04-09 15:57

距离AI「杀死」搜索引擎，到底还差几步？

来自主题: AI技术研报

7079 点击 2024-04-09 14:52

自动将不同开源模型进行组合，生成具有新能力的新模型，Sakana AI开发的新方法做到了！

来自主题: AI技术研报

7355 点击 2024-04-08 16:25

第一个能听懂你说话的语气、有“情商”的AI火了！

来自主题: AI技术研报

6613 点击 2024-04-08 14:47

中国领先的 Data Centric AI 赋能平台及解决方案服务商

来自主题: AI资讯

5396 点击 2024-04-07 17:52