这一代AI追随者的窘境
这一代AI追随者的窘境前不久,原阿里首席AI科学家贾扬清的一条朋友圈截图四处流传。贾扬清说,他的一个朋友告诉他,某国产大模型不过是LLaMA架构,只是更换了几个变量名而已。 很快有好事者发现,在大模型、数据集开源社区Hugging Face上,就有一位开发者发出了类似质疑:“该模型使用了Meta LLaMA 的架构,只修改个tensor(张量)”。
前不久,原阿里首席AI科学家贾扬清的一条朋友圈截图四处流传。贾扬清说,他的一个朋友告诉他,某国产大模型不过是LLaMA架构,只是更换了几个变量名而已。 很快有好事者发现,在大模型、数据集开源社区Hugging Face上,就有一位开发者发出了类似质疑:“该模型使用了Meta LLaMA 的架构,只修改个tensor(张量)”。
AGI 到底离我们还有多远?在 ChatGPT 引发的新一轮 AI 爆发之后,伯克利和香港大学的马毅教授领导的一个研究团队给出了自己的最新研究结果:包括 GPT-4 在内的当前 AI 系统所做的正是压缩。
学术造假有了GPT-4,变得更容易了.这两天,一篇刊登在Nature上的新闻表示,GPT-4生成的造假数据集,第一眼还真不一定看得出来。
搜索引擎、手机、电子商务、社交网站等的个人数据,仅占全世界数据量的1成。剩下的9成是工业数据,尚未得到加工利用。企业订单、物联网、汽车行驶数据等,这些企业数据一旦统合,将是一场革新。工业数据争夺将愈演愈烈……
计划训练一个10B的模型,想知道至少需要多大的数据?收集到了1T的数据,想知道能训练一个多大的模型?老板准备1个月后开发布会,给的资源是100张A100,那应该用多少数据训一个多大模型最终效果最好?
C-MCR利用现有多模态对比表征间可能存在的重叠模态,来连接不同的对比表征,从而学到更多模态间的对齐关系,实现了在缺乏配对数据的多模态间进行训练。
微软在最近的Ignite大会上宣布了一系列以AI为中心的新产品和功能,包括自研芯片、端到端机架和数据平台等。微软已经成为全球最潮的科技公司之一。
专注于人工智能医学影像分析的美国RapidAI公司宣布,美国食品药品监督管理局(FDA)批准其Rapid SDH用于美国的医院。Rapid SDH 由 AI (人工智能)提供支持,其AI 用过往的患者数据进行训练,以发现急性和慢性硬膜下血肿的潜在指标。
评估大模型对齐表现最高效的方式是?在生成式AI趋势里,让大模型回答和人类价值(意图)一致非常重要,也就是业内常说的对齐(Alignment)。
数据显示,2017年,医疗人工智能行业发展迅速。行业内仅对外公布的融资事件就有近30起,融资总额超过18亿元人民币,其中,推想医疗、深睿医疗、图玛深维等均在一年内获得两次融资,且融资规模在亿元以上。