AI资讯新闻榜单内容搜索-大模

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 大模
盘点2023,大模型产业狂奔的365天

盘点2023,大模型产业狂奔的365天

盘点2023,大模型产业狂奔的365天

如果说2023年有一项技术能够达到如此空前的“热度”,毫无疑问,那就是生成式大语言模型。但是不同于那不足十亿分之一秒的、转瞬即逝的4万亿度高温,大模型对各行各业的深远影响,在2023年既如“春雷万钧”,又似“润物无声”。所以,如果要用两个关键词形容2023年的大模型产业,除了“热”,还有“卷”。

来自主题: AI资讯
8860 点击    2023-12-31 14:43
无需额外训练提升模型30%性能!DeepMind科学家点赞MIT博士生实习成果

无需额外训练提升模型30%性能!DeepMind科学家点赞MIT博士生实习成果

无需额外训练提升模型30%性能!DeepMind科学家点赞MIT博士生实习成果

一个来自MIT博士生的惊人发现:只需对Transformer的特定层进行一种非常简单的修剪,即可在缩小模型规模的同时显著提高模型性能。

来自主题: AI技术研报
2097 点击    2023-12-31 12:01
回顾2023,那些令 AI 圈大地震的瞬间!

回顾2023,那些令 AI 圈大地震的瞬间!

回顾2023,那些令 AI 圈大地震的瞬间!

一年前,ChatGPT 横空出世,“大模型”成为全球科技赛道绝对的“C位”。 这一年,国外微软OpenAI和谷歌DeepMind等“众神”打架,国内百模大战。这一年,文生图以及文生视频赛道都出现了很强的玩家和令人惊艳的产品,如 Midjourney、Runway Gen-2、Pika 1.0等。

来自主题: AI资讯
5697 点击    2023-12-31 11:54
日活百万AI陪聊软件,海外爆红,背靠国内初创企业

日活百万AI陪聊软件,海外爆红,背靠国内初创企业

日活百万AI陪聊软件,海外爆红,背靠国内初创企业

AI Chat把大模型变成人类想象力的引擎。就像电影《Her》表现的那样,主人公可以和逝世多年的Alan Wstts的虚拟AI在线聊天。

来自主题: AI资讯
5033 点击    2023-12-30 16:03
挑战Transformer,华为诺亚新架构盘古π来了,已有1B、7B模型

挑战Transformer,华为诺亚新架构盘古π来了,已有1B、7B模型

挑战Transformer,华为诺亚新架构盘古π来了,已有1B、7B模型

近日,来自华为诺亚方舟实验室、北京大学等机构的研究者提出了盘古 π 的网络架构,尝试来构建更高效的大模型架构。

来自主题: AI资讯
10575 点击    2023-12-30 15:20
从模型、数据和框架三个视角出发,这里有份54页的高效大语言模型综述

从模型、数据和框架三个视角出发,这里有份54页的高效大语言模型综述

从模型、数据和框架三个视角出发,这里有份54页的高效大语言模型综述

大规模语言模型(LLMs)在很多关键任务中展现出显著的能力,比如自然语言理解、语言生成和复杂推理,并对社会产生深远的影响。然而,这些卓越的能力伴随着对庞大训练资源的需求(如下图左)和较长推理时延(如下图右)。因此,研究者们需要开发出有效的技术手段去解决其效率问题。

来自主题: AI技术研报
4860 点击    2023-12-30 15:16
多模态大模型学杂了能力反下降?新研究:MoE+通用专家解决冲突

多模态大模型学杂了能力反下降?新研究:MoE+通用专家解决冲突

多模态大模型学杂了能力反下降?新研究:MoE+通用专家解决冲突

多模态大模型做“多任务指令微调”,大模型可能会“学得多错得多”,因为不同任务之间的冲突,导致泛化能力下降。

来自主题: AI资讯
4951 点击    2023-12-30 14:39
向量数据库凉了吗?

向量数据库凉了吗?

向量数据库凉了吗?

向量存储检索是个真需求,然而专用向量数据库已经凉了。

来自主题: AI资讯
6779 点击    2023-12-30 14:32
赤兔大模型难救容联云?

赤兔大模型难救容联云?

赤兔大模型难救容联云?

价格战、估值缩水、市值腰 斩、持续亏损、股价暴跌、资本退潮,入局一家亏损一家成为常态。 国内 SaaS产业从2015年至今历经8年探索,且在大量资本热钱涌入下,仍未找到清晰的盈利模型。

来自主题: AI资讯
10207 点击    2023-12-30 10:35