AI资讯新闻榜单内容搜索-大模

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 大模
马斯克的首款多模态大模型来了,GPT-4V又被超越了一次

马斯克的首款多模态大模型来了,GPT-4V又被超越了一次

马斯克的首款多模态大模型来了,GPT-4V又被超越了一次

自从 2023 年 11 月 Grok 首次亮相以来,马斯克的 xAI 正在大模型领域不断取得进步,向 OpenAI 等先行者发起进攻。在 Grok-1 开源后不到一个月,xAI 的首个多模态模型就问世了。

来自主题: AI技术研报
12177 点击    2024-04-14 17:41
OpenAI推销ChatGPT to B业务,微软客户也是目标

OpenAI推销ChatGPT to B业务,微软客户也是目标

OpenAI推销ChatGPT to B业务,微软客户也是目标

奥特曼接待了数百名 500 强公司的高管。 技术领先的 OpenAI,正在稳步推进大模型能力的落地。

来自主题: AI资讯
5039 点击    2024-04-14 14:34
谷歌:假如AI大模型支持无限长上下文,会如何?

谷歌:假如AI大模型支持无限长上下文,会如何?

谷歌:假如AI大模型支持无限长上下文,会如何?

为解决大模型(LLMs)在处理超长输入序列时遇到的内存限制问题,本文作者提出了一种新型架构:Infini-Transformer,它可以在有限内存条件下,让基于Transformer的大语言模型(LLMs)高效处理无限长的输入序列。实验结果表明:Infini-Transformer在长上下文语言建模任务上超越了基线模型,内存最高可节约114倍。

来自主题: AI资讯
9765 点击    2024-04-14 11:32
改变LoRA的初始化方式,北大新方法PiSSA显著提升微调效果

改变LoRA的初始化方式,北大新方法PiSSA显著提升微调效果

改变LoRA的初始化方式,北大新方法PiSSA显著提升微调效果

随着大模型的参数量日益增长,微调整个模型的开销逐渐变得难以接受。 为此,北京大学的研究团队提出了一种名为 PiSSA 的参数高效微调方法,在主流数据集上都超过了目前广泛使用的 LoRA 的微调效果。

来自主题: AI技术研报
11617 点击    2024-04-13 16:50
直接扩展到无限长,谷歌Infini-Transformer终结上下文长度之争

直接扩展到无限长,谷歌Infini-Transformer终结上下文长度之争

直接扩展到无限长,谷歌Infini-Transformer终结上下文长度之争

谷歌又放大招了,发布下一代 Transformer 模型 Infini-Transformer。

来自主题: AI技术研报
10610 点击    2024-04-13 16:44
企业级AI Agent如何落地汽车行业,这是国内首份系统阐述白皮书

企业级AI Agent如何落地汽车行业,这是国内首份系统阐述白皮书

企业级AI Agent如何落地汽车行业,这是国内首份系统阐述白皮书

一年多来,大模型技术的进步日新月异,模型能力的上限不断抬高。但从产业变革的角度看,大模型的落地或许刚刚处于开端阶段。如何才能发挥出大模型的巨大潜力,并推动生产力更快更好地变革,仍然是一个充满探索空间的课题。

来自主题: AI资讯
9421 点击    2024-04-13 13:25
面壁不只要做中国Mistral,还要超过它

面壁不只要做中国Mistral,还要超过它

面壁不只要做中国Mistral,还要超过它

时隔七十多天,面壁在发布了MiniCPM-2B后又带来四个特性鲜明的模型,同时它还官宣了数亿元的新融资。

来自主题: AI资讯
9866 点击    2024-04-13 13:22