AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
解密中国首个“音乐版Sora” | 中国AIGC产业峰会

解密中国首个“音乐版Sora” | 中国AIGC产业峰会

解密中国首个“音乐版Sora” | 中国AIGC产业峰会

文生图、文生音频、文生视频、AI搜索引擎……大模型在多模态的进程可谓是愈演愈烈。

来自主题: AI技术研报
12131 点击    2024-05-01 19:50
登Nature子刊,「机器人+AI+MD模拟」加速材料发现和设计,发现全天然塑料替代品

登Nature子刊,「机器人+AI+MD模拟」加速材料发现和设计,发现全天然塑料替代品

登Nature子刊,「机器人+AI+MD模拟」加速材料发现和设计,发现全天然塑料替代品

塑料垃圾严重影响生态平衡和人类健康。近年来,材料科学家一直在努力寻找可用于包装、产品制造的塑料全天然替代品。

来自主题: AI技术研报
11979 点击    2024-05-01 19:45
参数量不到10亿的OctopusV3,如何媲美GPT-4V和GPT-4?

参数量不到10亿的OctopusV3,如何媲美GPT-4V和GPT-4?

参数量不到10亿的OctopusV3,如何媲美GPT-4V和GPT-4?

多模态 AI 系统的特点在于能够处理和学习包括自然语言、视觉、音频等各种类型的数据,从而指导其行为决策。近期,将视觉数据纳入大型语言模型 (如 GPT-4V) 的研究取得了重要进展,但如何有效地将图像信息转化为 AI 系统的可执行动作仍面临挑战。

来自主题: AI技术研报
9962 点击    2024-05-01 19:35
「用 AI 训 AI」这事靠谱吗?

「用 AI 训 AI」这事靠谱吗?

「用 AI 训 AI」这事靠谱吗?

在大语言模型领域,微调是改进模型的重要步骤。伴随开源模型数量日益增多,针对LLM的微调方法同样在推陈出新。

来自主题: AI技术研报
10172 点击    2024-05-01 19:31
染上AI,中国配音圈要完了?

染上AI,中国配音圈要完了?

染上AI,中国配音圈要完了?

已经数不清网友第多少次因AI吵得不可开交,只知道最近一次大混战起于配音圈,且争论还在持续。

来自主题: AI技术研报
12540 点击    2024-05-01 12:50
小红书让智能体们吵起来了!联合复旦推出大模型专属群聊工具

小红书让智能体们吵起来了!联合复旦推出大模型专属群聊工具

小红书让智能体们吵起来了!联合复旦推出大模型专属群聊工具

语言,不仅仅是文字的堆砌,更是表情包的狂欢,是梗的海洋,是键盘侠的战场(嗯?哪里不对)。

来自主题: AI技术研报
10233 点击    2024-05-01 12:45
从今天起,ChatGPT会记住每一位付费用户

从今天起,ChatGPT会记住每一位付费用户

从今天起,ChatGPT会记住每一位付费用户

现在,ChatGPT记忆功能,向所有Plus用户开放!

来自主题: AI技术研报
3603 点击    2024-05-01 12:32
在12个视频理解任务中,Mamba先打败了Transformer

在12个视频理解任务中,Mamba先打败了Transformer

在12个视频理解任务中,Mamba先打败了Transformer

探索视频理解的新境界,Mamba 模型引领计算机视觉研究新潮流!传统架构的局限已被打破,状态空间模型 Mamba 以其在长序列处理上的独特优势,为视频理解领域带来了革命性的变革。

来自主题: AI技术研报
7574 点击    2024-04-30 18:28
「非常接近GPT-4」的WizardLM-2被微软紧急撤回,有什么内幕?

「非常接近GPT-4」的WizardLM-2被微软紧急撤回,有什么内幕?

「非常接近GPT-4」的WizardLM-2被微软紧急撤回,有什么内幕?

前段时间,微软搞了个乌龙:隆重地开源了 WizardLM-2,又在不久后撤回得干干净净。

来自主题: AI技术研报
8813 点击    2024-04-30 17:48
具身智能最佳形态是什么?它是通往AGI必由之路?八位头部玩家、学者现身说法

具身智能最佳形态是什么?它是通往AGI必由之路?八位头部玩家、学者现身说法

具身智能最佳形态是什么?它是通往AGI必由之路?八位头部玩家、学者现身说法

ChatGPT-4 被认为是人工智能技术发展的重要节点,语言大模型之后的多模态大模型初步显现了世界模型的影子。大模型最终将通过硬件与物理世界产生交互。人工智能的应用实现从数字世界到物理世界的扩展,具身智能是非常关键的技术方向。

来自主题: AI技术研报
7479 点击    2024-04-30 17:43
打通AI「任督二脉」,国产自研通用大模型「砭石」实力迈向AGI

打通AI「任督二脉」,国产自研通用大模型「砭石」实力迈向AGI

打通AI「任督二脉」,国产自研通用大模型「砭石」实力迈向AGI

每一次关键技术取得通用化的突破,都会深刻改变生产方式,并显著提升生产力水平,而「大模型」成为了打通人工智能技术通用性「任督二脉」的关键。智慧眼,作为全球领先的人工智能企业,最近推出了其创新研发的通用大模型——砭石。

来自主题: AI技术研报
2946 点击    2024-04-30 17:35
黄仁勋“人肉快递”,掀起900亿美元算力争夺战

黄仁勋“人肉快递”,掀起900亿美元算力争夺战

黄仁勋“人肉快递”,掀起900亿美元算力争夺战

全球首台,黄仁勋亲自送货上门,OpenAI首发,DGX H200算是把流量拉满了。

来自主题: AI技术研报
8733 点击    2024-04-30 17:18
苹果紧急下架,这种一键除衣的AI,太逆天了

苹果紧急下架,这种一键除衣的AI,太逆天了

苹果紧急下架,这种一键除衣的AI,太逆天了

时间倒回前几年,如果小雷和小伙伴们聊聊AI,你们可能觉得我在天方夜谭?

来自主题: AI技术研报
11937 点击    2024-04-30 10:43
CVPR 2024 | 文本一键转3D数字人骨骼动画,阿尔伯塔大学提出MoMask框架

CVPR 2024 | 文本一键转3D数字人骨骼动画,阿尔伯塔大学提出MoMask框架

CVPR 2024 | 文本一键转3D数字人骨骼动画,阿尔伯塔大学提出MoMask框架

想象一下,你仅需要输入一段简单的文本描述,就可以生成对应的 3D 数字人动画的骨骼动作。而以往,这通常需要昂贵的动作捕捉设备或是专业的动画师逐帧绘制。这些骨骼动作可以进一步的用于游戏开发,影视制作,或者虚拟现实应用。来自阿尔伯塔大学的研究团队提出的新一代 Text2Motion 框架,MoMask,正在让这一切变得可能。

来自主题: AI技术研报
9191 点击    2024-04-29 20:45
Sora爆红视频幕后:被骗了,用了成吨的后期才有这效果

Sora爆红视频幕后:被骗了,用了成吨的后期才有这效果

Sora爆红视频幕后:被骗了,用了成吨的后期才有这效果

今年 2 月份,OpenAI 发布了人工智能文生视频大模型 Sora,并放出了第一批视频片段,掀起了 AI 生成视频浪潮。目前,Sora 仍未进行公测,只有一些视觉艺术家、设计师、电影制作人等获得了 Sora 的访问权限。他们发布了一些 Sora 生成的视频短片,其连贯、逼真的生成效果令人惊艳。

来自主题: AI技术研报
8628 点击    2024-04-29 20:42
LLM上下文窗口突破200万!无需架构变化+复杂微调,轻松扩展8倍

LLM上下文窗口突破200万!无需架构变化+复杂微调,轻松扩展8倍

LLM上下文窗口突破200万!无需架构变化+复杂微调,轻松扩展8倍

大型语言模型(LLM)往往会追求更长的「上下文窗口」,但由于微调成本高、长文本稀缺以及新token位置引入的灾难值(catastrophic values)等问题,目前模型的上下文窗口大多不超过128k个token

来自主题: AI技术研报
9170 点击    2024-04-29 20:31
全球首个自主进化多模态MoE震撼登场!写真视频击败Sora,人大系团队自研底座VDT

全球首个自主进化多模态MoE震撼登场!写真视频击败Sora,人大系团队自研底座VDT

全球首个自主进化多模态MoE震撼登场!写真视频击败Sora,人大系团队自研底座VDT

在4月27日召开的中关村论坛通用人工智能平行论坛上,人大系初创公司智子引擎隆重发布全新的多模态大模型Awaker 1.0,向AGI迈出至关重要的一步。

来自主题: AI技术研报
7355 点击    2024-04-29 20:27
Sora大片真相:人工特效参与,被指误导大众

Sora大片真相:人工特效参与,被指误导大众

Sora大片真相:人工特效参与,被指误导大众

啊?Sora火爆短片《气球人》,也“造假”了???

来自主题: AI技术研报
6987 点击    2024-04-29 20:11
国产GPU重大利好!“中国英伟达”千卡集群已就位

国产GPU重大利好!“中国英伟达”千卡集群已就位

国产GPU重大利好!“中国英伟达”千卡集群已就位

算力基础设施建设,北京市有了最新的大动作—— 《北京市算力基础设施建设实施方案(2024-2027年)》

来自主题: AI技术研报
7296 点击    2024-04-29 11:11