AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
PyTorch官宣:告别CUDA,GPU推理迎来Triton加速新时代

PyTorch官宣:告别CUDA,GPU推理迎来Triton加速新时代

PyTorch官宣:告别CUDA,GPU推理迎来Triton加速新时代

用英伟达的GPU,但可以不用CUDA?PyTorch官宣,借助OpenAI开发的Triton语言编写内核来加速LLM推理,可以实现和CUDA类似甚至更佳的性能。

来自主题: AI技术研报
5860 点击    2024-09-07 11:26
Nature子刊:AI模型测「大脑年龄」,究竟哪些因素会加速大脑衰老?

Nature子刊:AI模型测「大脑年龄」,究竟哪些因素会加速大脑衰老?

Nature子刊:AI模型测「大脑年龄」,究竟哪些因素会加速大脑衰老?

Nature子刊新研究「大脑时钟」可以判断一个人的大脑衰老速度是否快于实际年龄。结果显示,女性、不平等现象严重的国家和拉丁美洲国家的人,大脑衰老速度更快。

来自主题: AI技术研报
5686 点击    2024-09-07 11:19
让大模型能听会说,国内机构开源全球首个端到端语音对话模型Mini-Omni

让大模型能听会说,国内机构开源全球首个端到端语音对话模型Mini-Omni

让大模型能听会说,国内机构开源全球首个端到端语音对话模型Mini-Omni

本文出自启元世界多模态算法组,共同一作是来自清华大学的一年级硕士生谢之非与启元世界多模态负责人吴昌桥,研究兴趣为多模态大模型、LLM Agents 等。本论文上线几天内在 github 上斩获 1000+ 星标。

来自主题: AI技术研报
9701 点击    2024-09-07 11:04
ECCV 2024 | 比基准高30%,媲美Gemini 1.5 Pro,基于记忆的视频理解智能体来了

ECCV 2024 | 比基准高30%,媲美Gemini 1.5 Pro,基于记忆的视频理解智能体来了

ECCV 2024 | 比基准高30%,媲美Gemini 1.5 Pro,基于记忆的视频理解智能体来了

视频理解仍然是计算机视觉和人工智能领域的一个主要挑战。最近在视频理解上的许多进展都是通过端到端地训练多模态大语言模型实现的[1,2,3]。然而,当这些模型处理较长的视频时,内存消耗可能会显著增加,甚至变得难以承受,并且自注意力机制有时可能难以捕捉长程关系 [4]。这些问题阻碍了将端到端模型进一步应用于视频理解。

来自主题: AI技术研报
9727 点击    2024-09-06 11:59
北大领衔,多智能体强化学习研究登上Nature子刊

北大领衔,多智能体强化学习研究登上Nature子刊

北大领衔,多智能体强化学习研究登上Nature子刊

近日,由北京大学人工智能研究院杨耀东课题组牵头完成的研究成果 ——「大规模多智能体系统的高效强化学习」在人工智能顶级学术期刊 Nature Machine Intelligence 上发表。

来自主题: AI技术研报
8888 点击    2024-09-06 11:55
吴恩达,对 Agentic Workflow 持续兴奋

吴恩达,对 Agentic Workflow 持续兴奋

吴恩达,对 Agentic Workflow 持续兴奋

继吴恩达在今年 4 月红杉 AI 峰会演讲过去之后,Agent > GPT5?吴恩达最新演讲:四种 Agent 设计范式(通俗易懂版)。

来自主题: AI技术研报
8355 点击    2024-09-06 11:48
第一个100%开源的MoE大模型,7B的参数,1B的推理成本

第一个100%开源的MoE大模型,7B的参数,1B的推理成本

第一个100%开源的MoE大模型,7B的参数,1B的推理成本

训练代码、中间 checkpoint、训练日志和训练数据都已经开源。

来自主题: AI技术研报
10402 点击    2024-09-05 22:02
3天把Llama训成Mamba,性能不降,推理更快!

3天把Llama训成Mamba,性能不降,推理更快!

3天把Llama训成Mamba,性能不降,推理更快!

近日,Mamba方面又搞出了有意思的研究:来自康奈尔、普林斯顿等机构的研究人员成功将Llama提炼成了Mamba模型,并且设计了新的推测解码算法,加速了模型的推理。

来自主题: AI技术研报
9049 点击    2024-09-05 15:31
Ilya三个月肝出50亿美金独角兽!SSI 10人团队不走OpenAI老路

Ilya三个月肝出50亿美金独角兽!SSI 10人团队不走OpenAI老路

Ilya三个月肝出50亿美金独角兽!SSI 10人团队不走OpenAI老路

就在刚刚,Ilya创业新公司SSI完成一笔10亿美元融资。公司仅仅成立3个月,10位成员,如此神速地拿到巨额融资。目前,公司估值高达50亿美金。

来自主题: AI技术研报
9333 点击    2024-09-05 15:26
全球最大,马斯克4个月建成10万张H100超算集群!xAI算力超越OpenAI,奥特曼怕了

全球最大,马斯克4个月建成10万张H100超算集群!xAI算力超越OpenAI,奥特曼怕了

全球最大,马斯克4个月建成10万张H100超算集群!xAI算力超越OpenAI,奥特曼怕了

两天前,马斯克得意自曝:团队仅用122天,就建成了10万张H100的Colossus集群,未来还会扩展到15万张H100和5万张H200。此消息一出,奥特曼都被吓到了:xAI的算力已经超过OpenAI了,还给员工承诺了价值2亿期权,这是要上天?

来自主题: AI技术研报
8184 点击    2024-09-05 15:20
极光发布《AI生产力工具暑期发展报告》 夸克新增用户数量领跑行业

极光发布《AI生产力工具暑期发展报告》 夸克新增用户数量领跑行业

极光发布《AI生产力工具暑期发展报告》 夸克新增用户数量领跑行业

报告显示,目前国内生成式AI应用快速发展,预计市场规模有望达到4000亿元。 9月3日,极光旗下月狐数据发布《AI生产力工具暑期发展报告》。数据显示,AI生产力工具在用户侧呈现高速增长态势,总体月活跃用户数量达1.7亿。其中,夸克APP实现暑期新增用户数量行业第一,凭借大模型、数据、场景等优势,让更多用户享受到一站式AI服务。

来自主题: AI技术研报
6082 点击    2024-09-05 09:10
大模型走向物理世界,TeleAI 发布大模型驱动的具身智能综述,覆盖300篇文献

大模型走向物理世界,TeleAI 发布大模型驱动的具身智能综述,覆盖300篇文献

大模型走向物理世界,TeleAI 发布大模型驱动的具身智能综述,覆盖300篇文献

近年来,大模型在人工智能领域掀起了一场革命,各种文本、图像、多模态大模型层出不穷,已经深深地改变了人们的工作和生活方式。

来自主题: AI技术研报
9017 点击    2024-09-04 23:24
Meta:大语言模型可以通过自我批判取得大幅提升!

Meta:大语言模型可以通过自我批判取得大幅提升!

Meta:大语言模型可以通过自我批判取得大幅提升!

论文的审稿模式想必大家都不会陌生,一篇论文除了分配多个评审,最后还将由PC综合评估各位审稿人的reviews撰写meta-review。

来自主题: AI技术研报
8046 点击    2024-09-04 23:07
为边缘开发由生成式 AI 赋能的视觉 AI 智能体

为边缘开发由生成式 AI 赋能的视觉 AI 智能体

为边缘开发由生成式 AI 赋能的视觉 AI 智能体

视觉语言模型(VLM)这项 AI 技术所取得的突破令人振奋。它提供了一种更加动态、灵活的视频分析方法。VLM 使用户能够使用自然语言与输入的图像和视频进行交互,因此更加易于使用且更具适应性。这些模型可以通过 NIM 在 NVIDIA Jetson Orin 边缘 AI 平台或独立 GPU 上运行。本文将探讨如何构建基于 VLM 的视觉 AI 智能体,这些智能体无论是在边缘抑或是在云端都能运行。

来自主题: AI技术研报
9324 点击    2024-09-04 16:04
盘点丨那些 AI 公司悄咪咪上线的产品(十二)

盘点丨那些 AI 公司悄咪咪上线的产品(十二)

盘点丨那些 AI 公司悄咪咪上线的产品(十二)

欢迎来到悄咪咪系列的第十二期!这一次我们将介绍四款产品。

来自主题: AI技术研报
9219 点击    2024-09-04 15:59
清华EconAgent获ACL 2024杰出论文:大模型智能体革新计算经济学研究范式

清华EconAgent获ACL 2024杰出论文:大模型智能体革新计算经济学研究范式

清华EconAgent获ACL 2024杰出论文:大模型智能体革新计算经济学研究范式

近日,清华大学电子系城市科学与计算研究中心的研究论文《EconAgent: Large Language Model-Empowered Agents for Simulating Macroeconomic Activities》获得自然语言处理顶会 ACL 2024杰出论文奖(Outstanding Paper Award)。

来自主题: AI技术研报
9024 点击    2024-09-04 15:53
DeepMind最新成果剑指量子力学,FermiNet或将破解近百年计算难题

DeepMind最新成果剑指量子力学,FermiNet或将破解近百年计算难题

DeepMind最新成果剑指量子力学,FermiNet或将破解近百年计算难题

DeepMind联合帝国理工学院的学者,专注于用神经网络方法对量子力学中经典的薛定谔方程进行近似求解。继2020年提出FermiNet后,团队的最新成果——求解量子激发态,登上Science。

来自主题: AI技术研报
7988 点击    2024-09-04 15:48
1000个智能体创建首个「AI文明」!北大校友放弃MIT教职打造「西部世界」

1000个智能体创建首个「AI文明」!北大校友放弃MIT教职打造「西部世界」

1000个智能体创建首个「AI文明」!北大校友放弃MIT教职打造「西部世界」

在我的世界里,出现了有史以来第一个智能体文明。1000多个智能体一同协作,在虚拟世界中构建起,自己的经济、文化、宗教和政府。网友纷纷惊呼,西部世界真的来了。

来自主题: AI技术研报
8880 点击    2024-09-04 15:42
英伟达市值暴跌2万亿!一夜蒸发3个英特尔,创美国历史纪录

英伟达市值暴跌2万亿!一夜蒸发3个英特尔,创美国历史纪录

英伟达市值暴跌2万亿!一夜蒸发3个英特尔,创美国历史纪录

英伟达市值,一夜蒸发2790亿美元,创下美股史上单日最大跌幅!一天的损失,都赶上卖出的所有AI芯片了。「打倒英伟达垄断」的汹涌民意,终于有了具象化的一天。同时,英伟达已收到美国司法部传票,可谓噩耗连连。

来自主题: AI技术研报
8207 点击    2024-09-04 15:34
34页,超200篇文献,浙江大学最新综述,揭秘大语言模型中知识的利用机制

34页,超200篇文献,浙江大学最新综述,揭秘大语言模型中知识的利用机制

34页,超200篇文献,浙江大学最新综述,揭秘大语言模型中知识的利用机制

ChatGPT的出现引发了一场AI革命,它展示了通过简单对话就能完成各种任务的强大能力,并且将不同的 AI 功能整合到一个统一的平台上。还记得小编第一次使用 ChatGPT 的时候给我带来极大震撼。

来自主题: AI技术研报
8767 点击    2024-09-04 09:25