编码碾压ChatGPT!UIUC清华联手发布7B参数Magicoder,代码数据权重全开源
编码碾压ChatGPT!UIUC清华联手发布7B参数Magicoder,代码数据权重全开源全新代码大模型Magicoder,不到7B参数,就能在代码生成领域与顶级代码模型不相上下。
全新代码大模型Magicoder,不到7B参数,就能在代码生成领域与顶级代码模型不相上下。
NeurIPS收录的一项新研究,让大模型也学会“读心术”了!通过学习脑电波数据,模型成功地把受试者的脑电图信号翻译成了文本。
12月15日,上海交通大学医学院附属瑞金医院正式发布瑞金医学大模型矩阵,涵盖RJH-Base基座大模型、RJH-Med应用大模型,以及多模态大模型,并携手上海人工智能实验室、腾讯等建设可持续发展的医学大模型应用生态,实践以数据、知识、算法、模型为关键驱动的医学AI新范式。
AI可以从自己生成的「合成数据」中学习,最重要的是,能够大幅提升数据问题解决和代码生成的能力。
尽管我们无法预料大模型会生成什么,也不知道算力和数据的极限在哪里,但生成式 AI 革命是不可阻挡的。
随着大型语言模型(LLM)的发展,从业者面临更多挑战。如何避免 LLM 产生有害回复?如何快速删除训练数据中的版权保护内容?如何减少 LLM 幻觉(hallucinations,即错误事实)? 如何在数据政策更改后快速迭代 LLM?这些问题在人工智能法律和道德的合规要求日益成熟的大趋势下,对于 LLM 的安全可信部署至关重要。
ChatGPT 爆火一年,大模型的竞争走到哪一步了?从微信指数的数据,可以管中窥豹到各家大模型的感知度,ChatGPT 遥遥领先,依然是国内大模型们追赶的对象。
亚马逊云科技在数据库产品上有什么样的规划、他们如何看待纯向量数据库需求?
大模型长期以来一直存在一个致命的问题,即生成幻觉。由于数据集的复杂性,难免会包含过时和错误的信息,这使得输出质量面临着极大的挑战。过多的重复信息还可能导致大型模型产生偏见,这也算是一种形式的幻觉。
谷歌憋了许久的大招,双子座Gemini大模型终于发布!其中一图一视频最引人注目:一图,MMLU多任务语言理解数据集测试,Gemini Ultra不光超越GPT-4,甚至超越了人类专家。