AI资讯新闻榜单内容搜索-人工智

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 人工智
50s完成7B模型量化,4bit达到新SOTA,大模型低比特量化有新招了 | NeurIPS 2024 Oral

50s完成7B模型量化,4bit达到新SOTA,大模型低比特量化有新招了 | NeurIPS 2024 Oral

50s完成7B模型量化,4bit达到新SOTA,大模型低比特量化有新招了 | NeurIPS 2024 Oral

消除激活值(outliers),大语言模型低比特量化有新招了—— 自动化所、清华、港城大团队最近有一篇论文入选了NeurIPS 2024(Oral Presentation),他们针对LLM权重激活量化提出了两种正交变换,有效降低了outliers现象,达到了4-bit的新SOTA。

来自主题: AI技术研报
5416 点击    2024-11-07 20:51
一文读懂大模型在手机端的底层算力芯片

一文读懂大模型在手机端的底层算力芯片

一文读懂大模型在手机端的底层算力芯片

卖铲子相比蜂拥去淘金,永远是更好的选择。在大模型风靡全球、蕴含极大商业价值的今天,「先进铲子」之间的竞赛,正趋向白热化。

来自主题: AI资讯
6038 点击    2024-11-07 20:33
鸿蒙的“AI野望”:让AI融入操作系统,数亿补贴寻应用开发者

鸿蒙的“AI野望”:让AI融入操作系统,数亿补贴寻应用开发者

鸿蒙的“AI野望”:让AI融入操作系统,数亿补贴寻应用开发者

一个时代有一个时代的操作系统。 但已经趋势明确的AI时代,操作系统究竟长什么样?该有怎样的能力?以及谁会是那个天命OS……通通还没有共识。

来自主题: AI资讯
5896 点击    2024-11-07 20:08
喝点VC|红杉资本对谈AI搜索独角兽Glean CEO:必须找到你计划解决的商业问题,通过AI所提供的技术,以更好的方式解决问题

喝点VC|红杉资本对谈AI搜索独角兽Glean CEO:必须找到你计划解决的商业问题,通过AI所提供的技术,以更好的方式解决问题

喝点VC|红杉资本对谈AI搜索独角兽Glean CEO:必须找到你计划解决的商业问题,通过AI所提供的技术,以更好的方式解决问题

Glean可以把它想象成是企业内部的Google或ChatGPT,它是一个员工可以去提问的地方,而Glean会利用公司的知识来回答所有这些问题,无论这些知识存储在哪里,都会将其整合到一起。

来自主题: AI资讯
5097 点击    2024-11-07 20:03
深度|早期投资人相信:AI 编程助手可以帮助初创公司开发产品

深度|早期投资人相信:AI 编程助手可以帮助初创公司开发产品

深度|早期投资人相信:AI 编程助手可以帮助初创公司开发产品

到现在为止,世界上几乎没有程序员不以某种方式使用人工智能助手。但使用 GitHub Copilot 或 Cursor.AI 来询问技术问题和获取调试帮助可能只是个开始。人工智能编程有一天可能涉及能够根据自然语言提示自行编写程序的代理。这些程序甚至可能取代人类工程师。

来自主题: AI资讯
4087 点击    2024-11-07 19:56
从今天起,ChatGPT入口就是chat.com!

从今天起,ChatGPT入口就是chat.com!

从今天起,ChatGPT入口就是chat.com!

在买下ai.com之后,OpenAI又把chat.com纳入囊中了,据称花费了1500-2000万美金。相较于前者,chat.com更符合ChatGPT聊天的调性。如今,进入ChatGPT,只需6/8个字符就可以了。

来自主题: AI资讯
4789 点击    2024-11-07 18:27
OpenAI o1强推理能提升安全性?长对话诱导干翻o1

OpenAI o1强推理能提升安全性?长对话诱导干翻o1

OpenAI o1强推理能提升安全性?长对话诱导干翻o1

最近,以 OpenAI o1 为代表的 AI 大模型的推理能力得到了极大提升,在代码、数学的评估上取得了令人惊讶的效果。OpenAI 声称,推理可以让模型更好的遵守安全政策,是提升模型安全的新路径。

来自主题: AI技术研报
4162 点击    2024-11-07 18:17
字节豆包大模型团队突破残差连接局限!预训练收敛最快加速80%

字节豆包大模型团队突破残差连接局限!预训练收敛最快加速80%

字节豆包大模型团队突破残差连接局限!预训练收敛最快加速80%

字节跳动豆包大模型团队于近日提出超连接(Hyper-Connections),一种简单有效的残差连接替代方案。面向残差连接的主要变体的局限问题,超连接可通过动态调整不同层之间的连接权重,解决梯度消失和表示崩溃(Representation Collapse)之间的权衡困境。在 Dense 模型和 MoE 模型预训练中,超连接方案展示出显著的性能提升效果,使收敛速度最高可加速 80%。

来自主题: AI技术研报
6312 点击    2024-11-07 17:41