AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
浙大二院发布全国首个AI电子病历模型Medcopilot,AIGC+医疗的春天来了?

浙大二院发布全国首个AI电子病历模型Medcopilot,AIGC+医疗的春天来了?

浙大二院发布全国首个AI电子病历模型Medcopilot,AIGC+医疗的春天来了?

AIGC已然无所不在,场景探索日新月异。 近日,浙江大学医学院附属第二医院发布了国内首个嵌入AI大模型的电子病历系统——Medcopilot(医疗AI助手),最短数秒之内可生成一份出院小结。

来自主题: AI技术研报
9006 点击    2024-08-06 14:04
做AI转录,拿下日本、实现千万美金ARR

做AI转录,拿下日本、实现千万美金ARR

做AI转录,拿下日本、实现千万美金ARR

不久前,A16z AI 合伙人 Olivia Moore 分享了一张 AI 转录初创公司图谱,面向企业服务(B2B)的转录公司不仅数量多,更涉及人宠医疗、招聘、销售和会议等多元场景。其中作为“打工人刚需”的会议场景转录,参与厂商众多,我们也从中发现了一家非常有趣的华人创立公司——Notta。此前 TechCrunch 披露的融资信息显示,其总部位于新加坡,研发中心位于深圳。

来自主题: AI技术研报
9503 点击    2024-08-06 14:01
微软AI投资大出血引股价下跌,华尔街或将撤出AI「军备竞赛」

微软AI投资大出血引股价下跌,华尔街或将撤出AI「军备竞赛」

微软AI投资大出血引股价下跌,华尔街或将撤出AI「军备竞赛」

微软最近发布的财报,再次揭露了GenAI的成本真相。 报告显示,微软本季度在现金资本支出和设备购买上,花费了足足190亿美元,同比增长78%,相当于5年前一整年的支出总额。

来自主题: AI技术研报
9176 点击    2024-08-05 15:31
小扎自曝砸重金训Llama 4,24万块GPU齐发力!预计2025年发布

小扎自曝砸重金训Llama 4,24万块GPU齐发力!预计2025年发布

小扎自曝砸重金训Llama 4,24万块GPU齐发力!预计2025年发布

Llama 3.1刚发布不久,Llama 4已完全投入训练中。 这几天,小扎在二季度财报会上称,Meta将用Llama 3的十倍计算量,训练下一代多模态Llama 4,预计在2025年发布。

来自主题: AI技术研报
8093 点击    2024-08-05 15:25
70倍极致压缩!大模型的检查点再多也不怕

70倍极致压缩!大模型的检查点再多也不怕

70倍极致压缩!大模型的检查点再多也不怕

大模型作为当下 AI 工业界和学术界当之无愧的「流量之王」,吸引了大批学者和企业投入资源去研究与训练。随着规模越做越大,系统和工程问题已经成了大模型训练中绕不开的难题。例如在 Llama3.1 54 天的训练里,系统会崩溃 466 次,平均 2.78 小时一次!

来自主题: AI技术研报
9839 点击    2024-08-05 14:04
延迟交互模型,为什么是下一代RAG的标配?

延迟交互模型,为什么是下一代RAG的标配?

延迟交互模型,为什么是下一代RAG的标配?

在 RAG 系统开发中,良好的 Reranker 模型处于必不可少的环节,也总是被拿来放到各类评测当中,这是因为以向量搜索为代表的查询,会面临命中率低的问题,因此需要高级的 Reranker 模型来补救,这样就构成了以向量搜索为粗筛,以 Reranker 模型作精排的两阶段排序架构。

来自主题: AI技术研报
10984 点击    2024-08-05 13:58
英伟达最强AI芯片曝重大设计缺陷,中国特供版意外曝光!

英伟达最强AI芯片曝重大设计缺陷,中国特供版意外曝光!

英伟达最强AI芯片曝重大设计缺陷,中国特供版意外曝光!

因设计缺陷,英伟达最强AI芯片Blackwell,真的要延期发货了。金主爸爸们哀声一片,所有预定计划预计要拖延至少三个月。

来自主题: AI技术研报
11716 点击    2024-08-05 13:54
OpenAI突然公布SearchGPT,谷歌搜索大敌已至

OpenAI突然公布SearchGPT,谷歌搜索大敌已至

OpenAI突然公布SearchGPT,谷歌搜索大敌已至

靴子终于落地,OpenAI的AI搜索还是来了。7月26日,就在推出小模型GPT-4o mini的一周后,OpenAI方面公布了备受外界关注的搜索产品SearchGPT。尽管目前SearchGPT仅向10000名测试用户开放,但OpenAI CTO Mira Murati在社交平台已经透露,最终目标是将搜索功能直接整合到ChatGPT中。

来自主题: AI技术研报
8602 点击    2024-08-05 12:26
最强开源文生图模型一夜易主,SD原班人马打造,要发SOTA视频生成模型

最强开源文生图模型一夜易主,SD原班人马打造,要发SOTA视频生成模型

最强开源文生图模型一夜易主,SD原班人马打造,要发SOTA视频生成模型

最强开源文生图模型一夜易主! 智东西8月2日报道,昨日晚间,开源文生图模型霸主Stable Diffusion原班人马,宣布推出全新的图像生成模型FLUX.1。

来自主题: AI技术研报
7923 点击    2024-08-05 12:06
AI顶会ICML收了一篇论文:没算法没实验

AI顶会ICML收了一篇论文:没算法没实验

AI顶会ICML收了一篇论文:没算法没实验

没有算法没有实验,从2610篇收录论文中脱颖而出,成为唯一一篇纯理论入选2024 ICML Spotlight的论文。

来自主题: AI技术研报
10281 点击    2024-08-04 14:14
可解释性终极追问,什么才是第一性解释?20篇CCF-A+ICLR论文给你答案

可解释性终极追问,什么才是第一性解释?20篇CCF-A+ICLR论文给你答案

可解释性终极追问,什么才是第一性解释?20篇CCF-A+ICLR论文给你答案

本文首先简单回顾了『等效交互可解释性理论体系』(20 篇 CCF-A 及 ICLR 论文),并在此基础上,严格推导并预测出神经网络在训练过程中其概念表征及其泛化性的动力学变化,即在某种程度上,我们可以解释在训练过程中神经网络在任意时间点的泛化性及其内在根因。

来自主题: AI技术研报
9853 点击    2024-08-04 13:55
领英 AI 落地复盘:多 Agent 配合、端到端输出

领英 AI 落地复盘:多 Agent 配合、端到端输出

领英 AI 落地复盘:多 Agent 配合、端到端输出

在过去的六个月,LinkedIn 开发了基于自身业务的生成式AI应用。领英团队希望能重新设计求职流程,改变专业内容的浏览方式。

来自主题: AI技术研报
10869 点击    2024-08-04 13:26
DeepMind研究成本大起底,一篇ICML论文烧掉1290万美元

DeepMind研究成本大起底,一篇ICML论文烧掉1290万美元

DeepMind研究成本大起底,一篇ICML论文烧掉1290万美元

DeepMind最近被ICML 2024接收的一篇论文,完完全全暴露了他们背靠谷歌的「豪横」。一篇文章预估了这项研究所需的算力和成本,大概是Llama 3预训练的15%,耗费资金可达12.9M美元。

来自主题: AI技术研报
8348 点击    2024-08-03 15:03
GPT-4o弱点暴露了,PDF长文档阅读理解仅45分

GPT-4o弱点暴露了,PDF长文档阅读理解仅45分

GPT-4o弱点暴露了,PDF长文档阅读理解仅45分

图文并茂的PDF长文档在日常生活中无处不在。过去人们通常使用OCR,layout detection等方法对PDF长文档进行解析。但随着多模态大模型的发展,PDF长文档的端到端阅读理解成为了可能。

来自主题: AI技术研报
10778 点击    2024-08-03 14:38
首届大模型顶会COLM 高分论文:偏好搜索算法PairS,让大模型进行文本评估更高效

首届大模型顶会COLM 高分论文:偏好搜索算法PairS,让大模型进行文本评估更高效

首届大模型顶会COLM 高分论文:偏好搜索算法PairS,让大模型进行文本评估更高效

大模型展现出了卓越的指令跟从和任务泛化的能力,这种独特的能力源自 LLMs 在训练中使用了指令跟随数据以及人类反馈强化学习(RLHF)。

来自主题: AI技术研报
11012 点击    2024-08-03 14:29
顶级明星公司Character.AI创始人出走:我们都身在一个十字路口

顶级明星公司Character.AI创始人出走:我们都身在一个十字路口

顶级明星公司Character.AI创始人出走:我们都身在一个十字路口

热议数月的 Character AI 寻求收购的消息,终于尘埃落定。 据 C.AI 官方博客,公司与 Google 达成协议,核心创始人 Noam Shazeer、Daniel De Freitas 以及研究团队,将加入 Google,剩余「大部分团队」将留在 C.AI,继续打造产品。

来自主题: AI技术研报
7350 点击    2024-08-03 11:22
RAG 高效应用指南 05:再谈文档智能解析

RAG 高效应用指南 05:再谈文档智能解析

RAG 高效应用指南 05:再谈文档智能解析

在这篇文章中,笔者将讨论以下几个问题: • 什么是文档智能解析 • 文档智能解析有哪些方法 • 文档智能解析的开源实现

来自主题: AI技术研报
10478 点击    2024-08-03 11:17
RAG 高效应用指南 04:语义路由

RAG 高效应用指南 04:语义路由

RAG 高效应用指南 04:语义路由

在这篇文章中,笔者将讨论以下几个问题: • 什么是语义路由 • RAG 路由的不同场景

来自主题: AI技术研报
10088 点击    2024-08-03 11:05
RAG 高效应用指南 03:Query 理解

RAG 高效应用指南 03:Query 理解

RAG 高效应用指南 03:Query 理解

在这篇文章中,笔者将讨论以下几个问题: • 为什么要进行 query 理解 • query 理解有哪些技术(从 RAG 角度) • 各种 query 理解技术的实现(基于 LangChain)

来自主题: AI技术研报
12294 点击    2024-08-03 10:57
RAG 高效应用指南 02:Embedding 模型的选择和微调

RAG 高效应用指南 02:Embedding 模型的选择和微调

RAG 高效应用指南 02:Embedding 模型的选择和微调

在本篇文章中,笔者将讨论以下几个问题: • 向量模型在 RAG 系统中的作用 有哪些性能不错的向量模型(从 RAG 角度) 不同向量模型的评测基准 MTEB 业务中选择向量模型有哪些考量 如何 Finetune 向量模型

来自主题: AI技术研报
13760 点击    2024-08-03 10:44
RAG 高效应用指南:01

RAG 高效应用指南:01

RAG 高效应用指南:01

『RAG 高效应用指南』系列将就如何提高 RAG 系统性能进行深入探讨,提供一系列具体的方法和建议。同时读者也需要记住,提高 RAG 系统性能是一个持续的过程,需要不断地评估、优化和迭代。

来自主题: AI技术研报
12406 点击    2024-08-02 17:11
OpenDevin出技术报告了,大模型Agent开发者必读

OpenDevin出技术报告了,大模型Agent开发者必读

OpenDevin出技术报告了,大模型Agent开发者必读

今年 3 月,「全球首位 AI 软件工程师」Devin 引爆了 AI 圈。与此前 AI 编程助手不同的是,Devin 并不只是辅助编程的角色,而是能够独立地、端到端地完成整个开发项目。

来自主题: AI技术研报
9690 点击    2024-08-02 16:16
苹果让大模型学会偷懒:更快吐出第一个token,准确度还保住了

苹果让大模型学会偷懒:更快吐出第一个token,准确度还保住了

苹果让大模型学会偷懒:更快吐出第一个token,准确度还保住了

Llama 3.1 刚刚发布,你是否已经尝试了呢?就算你的个人计算机是最近的顶尖配置,运行其中最小的 8B 版本可能也依然会有明显延迟。为了提升模型的推理效率,研究者想出了多种多样的方法,但其中很多都会让模型牺牲一些准确度。

来自主题: AI技术研报
9899 点击    2024-08-02 16:07