AITNT-让一部分人先用AI实现商业化

拯救Transformer推理能力！DeepMind新研究TransNAR：给模型嵌入「算法推理大脑」

DeepMind最近发表的一篇论文提出用混合架构的方法解决Transformer模型的推理缺陷。将Transformer的NLU技能与基于GNN的神经算法推理器（NAR）的强大算法推理能力相结合，可以实现更加泛化、稳健、准确的LLM推理。

来自主题: AI技术研报

11412 点击 2024-06-17 21:30

答案抽取正确率达96.88%，xFinder断了大模型「作弊」的小心思

大语言模型（LLM）的迅速发展，引发了关于如何评估其公平性和可靠性的热议。

来自主题: AI技术研报

11378 点击 2024-06-17 19:37

字节豆包、武大提出 CAL：通过视觉相关的 token 增强多模态对齐效果

当前主流的视觉语言模型（VLM）主要基于大语言模型（LLM）进一步微调。因此需要通过各种方式将图像映射到 LLM 的嵌入空间，然后使用自回归方式根据图像 token 预测答案。

来自主题: AI技术研报

9734 点击 2024-06-17 19:35

大模型+蒙特卡洛树搜索，一招让LLaMa-3 8B奥数水平直逼GPT-4

通过算法层面的创新，未来大语言模型做数学题的水平会不断地提高。

来自主题: AI技术研报

11269 点击 2024-06-17 19:32

AI研究的主要推动力会是什么？ChatGPT团队研究科学家：算力成本下降

AI 研究发展的主要推动力是什么？在最近的一次演讲中，OpenAI 研究科学家 Hyung Won Chung 给出了自己的答案。

来自主题: AI技术研报

10972 点击 2024-06-17 19:30

3D 版 SORA 来了！DreamTech 推出全球首个原生 3D-DiT 大模型 Direct3D

2024 年 5 月，DreamTech 官宣了其高质量 3D 生成大模型 Direct3D，并公开了相关学术论文 Direct3D: Scalable Image-to-3D Generation via 3D Latent Diffusion Transformer。

来自主题: AI资讯

10936 点击 2024-06-17 19:23

谢赛宁对话Sora 负责人：AI 视觉的基础是对压缩图像的学习

语言将是获得更智能系统的重要组成部分。

来自主题: AI资讯

10085 点击 2024-06-17 19:20

苹果WWDC，AI小模型的批发时代

苹果讲了一个按Query难度分发模型的模式：B小模型：大多数场景，包括自动回复、改写、语法检查、Summary都用端侧的小模型跑。

来自主题: AI资讯

4469 点击 2024-06-17 16:22

2024人工智能指数报告（二）：技术性能

过去一年人工智能研究取得了重大突破

来自主题: AI技术研报

2641 点击 2024-06-17 09:51

反转？马斯克能否和OpenAI冰释前嫌？

马斯克禁用苹果设备是出于数据安全考虑，其实背后依旧暗藏着马斯克和OpenAI的纷争

来自主题: AI资讯

6150 点击 2024-06-17 09:36

专精AI+教育领域，「柯南AI」完成1000万元天使轮融资

在面对广阔的市场时，既不断进化自身的优势，又力求实现“小而美”的精致与专注

来自主题: AI资讯

10012 点击 2024-06-17 09:33

必须了解的8大AI术语

有大视角，才不会被细节迷惑。

来自主题: AI资讯

6056 点击 2024-06-17 09:29

让卖茶女破防的超级算法

文章讲述了彩云科技团队在改进Transformer架构方面的努力，尤其是推出的全新通用模型架构DCFormer，以及团队面临的种种挑战和突破。

来自主题: AI资讯

7581 点击 2024-06-17 09:24

高质量3D生成最有希望的一集？GaussianCube在三维生成中全面超越NeRF

在三维生成建模的研究领域，现行的两大类 3D 表示方法要么基于拟合能力不足的隐式解码器，要么缺乏清晰定义的空间结构难以与主流的 3D 扩散技术融合。来自中科大、清华和微软亚洲研究院的研究人员提出了 GaussianCube，这是一种具有强大拟合能力的显式结构化三维表示，并且可以无缝应用于目前主流的 3D 扩散模型中。

来自主题: AI技术研报

11471 点击 2024-06-16 18:15