AI资讯新闻榜单内容搜索-3

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 3
Llama架构比不上GPT2?神奇token提升10倍记忆?

Llama架构比不上GPT2?神奇token提升10倍记忆?

Llama架构比不上GPT2?神奇token提升10倍记忆?

近日,朱泽园 (Meta AI) 和李远志 (MBZUAI) 的最新研究《语言模型物理学 Part 3.3:知识的 Scaling Laws》用海量实验(50,000 条任务,总计 4,200,000 GPU 小时)总结了 12 条定律,为 LLM 在不同条件下的知识容量提供了较为精确的计量方法。

来自主题: AI资讯
6498 点击    2024-04-10 19:11
破解36年前魔咒!Meta推出反向训练大法消除大模型「逆转诅咒」

破解36年前魔咒!Meta推出反向训练大法消除大模型「逆转诅咒」

破解36年前魔咒!Meta推出反向训练大法消除大模型「逆转诅咒」

大语言模型的「逆转诅咒」,被解开了。近日,来自Meta FAIR的研究人员推出了反向训练大法,让模型从反方向上学到了事实之间的逻辑,终于改进了这个困扰人们已久的问题。

来自主题: AI技术研报
6876 点击    2024-04-09 15:57
GPT-4推理能力为0?开发者悬赏1万美金被打脸,神秘提示正确率直冲100%

GPT-4推理能力为0?开发者悬赏1万美金被打脸,神秘提示正确率直冲100%

GPT-4推理能力为0?开发者悬赏1万美金被打脸,神秘提示正确率直冲100%

小孩子都会的脑筋急转弯推理题,GPT-4和Claude 3做不出?国外一位开发者小哥坚称这一观点,认为GPT模型在训练集外毫无推理能力,无法实现AGI,甚至悬赏1万美元,发起比赛。然而,他当天就被光速打脸了!网友用高能的prompt,让GPT-4和Claude 3几乎达到百分百的正确率。

来自主题: AI技术研报
6224 点击    2024-04-09 10:32
GPU 经济学:算力背后的成本与未来

GPU 经济学:算力背后的成本与未来

GPU 经济学:算力背后的成本与未来

算力供需平衡预计到2030年才能实现

来自主题: AI技术研报
6503 点击    2024-04-08 10:30
阿里刚开源32B大模型,我们立马测试了“弱智吧”

阿里刚开源32B大模型,我们立马测试了“弱智吧”

阿里刚开源32B大模型,我们立马测试了“弱智吧”

阿里的通义千问(Qwen),终于拼齐了1.5系列的最后一块拼图—— 正式开源Qwen 1.5-32B。

来自主题: AI技术研报
8248 点击    2024-04-08 10:09
Q1 AGI 融资万字盘点:单笔最高30亿、PMF海外已跑通、资本军备竞赛已开启

Q1 AGI 融资万字盘点:单笔最高30亿、PMF海外已跑通、资本军备竞赛已开启

Q1 AGI 融资万字盘点:单笔最高30亿、PMF海外已跑通、资本军备竞赛已开启

在这个风起云涌的 AI 时代,一场前所未有的资本军备竞赛正在火热上演。算力、算法、数据,这些被视为 AI 领域的三大基石,正成为各大公司争夺的焦点。然而,在这场看似技术驱动的竞赛背后,低成本资金的获取却成为了决定胜负的隐形推手。

来自主题: AI资讯
7141 点击    2024-04-08 09:20
超越GPT-4,斯坦福团队手机可跑的大模型火了,一夜下载量超2k

超越GPT-4,斯坦福团队手机可跑的大模型火了,一夜下载量超2k

超越GPT-4,斯坦福团队手机可跑的大模型火了,一夜下载量超2k

在大模型落地应用的过程中,端侧 AI 是非常重要的一个方向。近日,斯坦福大学研究人员推出的 Octopus v2 火了,受到了开发者社区的极大关注,模型一夜下载量超 2k。20 亿参数的 Octopus v2 可以在智能手机、汽车、个人电脑等端侧运行,在准确性和延迟方面超越了 GPT-4,并将上下文长度减少了 95%。此外,Octopus v2 比 Llama7B + RAG 方案快 36 倍。

来自主题: AI技术研报
8859 点击    2024-04-07 17:44
中科大等意外发现:大模型不看图也能正确回答视觉问题!

中科大等意外发现:大模型不看图也能正确回答视觉问题!

中科大等意外发现:大模型不看图也能正确回答视觉问题!

大模型不看图,竟也能正确回答视觉问题?!中科大、香港中文大学、上海AI Lab的研究团队团队意外发现了这一离奇现象。他们首先看到像GPT-4V、GeminiPro、Qwen1.5-72B、Yi-VL-34B以及LLaVA-Next-34B等大模型,不管是闭源还是开源,语言模型还是多模态,竟然只根据在多模态基准MMMU测试中的问题和选项文本,就能获得不错的成绩。

来自主题: AI技术研报
6893 点击    2024-04-07 13:10
从300亿分子中筛出6款,结构新且易合成,斯坦福抗生素设计AI模型登Nature子刊

从300亿分子中筛出6款,结构新且易合成,斯坦福抗生素设计AI模型登Nature子刊

从300亿分子中筛出6款,结构新且易合成,斯坦福抗生素设计AI模型登Nature子刊

全球每年有近 500 万人死于抗生素耐药性,因此迫切需要新的方法来对抗耐药菌株。AI 方法可以发现新的抗生素,但现有方法有明显的局限性。性质预测模型很难扩展到大型化学空间。直接设计分子的生成模型可以快速探索广阔的化学空间,但生成的分子难以合成。

来自主题: AI技术研报
6734 点击    2024-04-06 15:23