AI技术研报-这里有最前沿的人工智能技术解读

突破86%，解耦LLM的记忆与推理，首个超越GPT-4o的推理框架（含prompt） | 最新

这是一个不容小觑的最新推理框架，它解耦了LLM的记忆与推理，用此框架Fine-tuned过的LLaMa-3.1-8B在TruthfulQA数据集上首次超越了GPT-4o。

来自主题: AI技术研报

8443 点击 2024-11-28 11:26

应用指南｜一分钟完成立案材料准备——基于GPT和编程

前段时间，笔者有幸参加了师兄主讲的《法律人如何使用AI系列讲座》第二期。讲座中提到，GPT不仅能够优化工作流程，还可以帮助没有任何编程经验的人编写代码。恰巧近期立案工作增加，需要逐一准备大量的立案材料（如所函、授权委托书、合同、介绍信等）。

来自主题: AI技术研报

7701 点击 2024-11-28 10:03

Fixie AI 推出 Ultravox v0.4.1：专门用于与 LLM 进行实时对话以及 GPT-4o 实时的替代方案

在人工智能领域，与AI进行无缝的实时交互一直是开发者和研究者面临的一大挑战。特别是将文本、图片、音频等多模态信息整合成一个连贯的对话系统，更是难上加难。尽管像GPT-4这样的语言模型在对话流畅性和上下文理解上取得了长足进步，但在实际应用中，这些模型仍然存在不足之处：

来自主题: AI技术研报

10623 点击 2024-11-28 09:53

基于向量模型的文本水印技术

在 EMNLP 2024 上，我们看到了向量模型的各种创新用法，其中最出人意料的莫过于：文本水印。

来自主题: AI技术研报

9567 点击 2024-11-28 09:17

AI卷翻科研！DeepMind 36页报告：全球实验室被「AI科学家」指数级接管

OpenAI科学家Jason Wei预测，未来一年内，AI重点将从推广大众需求转为促进科学发现，无独有偶，DeepMind刚刚发布的36页报告也揭示出：全球实验室AI使用正在指数级增长，AI for Science真正的黄金时代即将来临。

来自主题: AI技术研报

9889 点击 2024-11-27 18:02

不是RNN的锅！清华团队深入分析长上下文建模中的状态崩溃，Mamba作者点赞

RNN模型在长上下文中表现不佳？近日，来自清华的研究团队对此进行了深入的实验分析，结果表明：不是RNN的锅。

来自主题: AI技术研报

10497 点击 2024-11-27 17:10

一文看尽Meta开源大礼包！全面覆盖图像分割、语音、文本、表征、材料发现、密码安全性等

Meta最近开源了多个AI项目，包括图像分割模型SAM 2.1、多模态语言模型Spirit LM、自学评估器和改进的跨语言句子编码器Mexma等，提升了AI在图像处理和语音识别领域的能力，进一步推动了AI研究的进展。

来自主题: AI技术研报

10489 点击 2024-11-27 16:50

AI造芯Nature论文遭围攻，谷歌发文硬刚学术抹黑！Jeff Dean怒怼：你们连模型都没训

近日，面对EDA界对于自家AlphaChip的质疑，谷歌首席科学家Jeff Dean以论文回应论文，并表示：大家注意，这是同行竞争！

来自主题: AI技术研报

10941 点击 2024-11-27 16:39

HuggingFace工程师亲授：如何在Transformer中实现最好的位置编码

一个有效的复杂系统总是从一个有效的简单系统演化而来的。——John Gall

来自主题: AI技术研报

9075 点击 2024-11-27 16:22

AI 知识库对比：Dify 还是 FastGPT

之前出了一些 Dify 的基础教程，后台有小伙伴经常问三金：Dify 和 fastGPT 哪个好啊？我该用哪个呢？为了帮小伙伴解开这个疑惑，今儿三金就先带大家分别看下这两个产品在知识库上的异同点。废话不多说，开整！

来自主题: AI技术研报

9899 点击 2024-11-27 14:53

跨模态大升级！少量数据高效微调，LLM教会CLIP玩转复杂文本

在当今多模态领域，CLIP 模型凭借其卓越的视觉与文本对齐能力，推动了视觉基础模型的发展。CLIP 通过对大规模图文对的对比学习，将视觉与语言信号嵌入到同一特征空间中，受到了广泛应用。

来自主题: AI技术研报

7009 点击 2024-11-27 14:41

将偏好学习引入模型训练，北大李戈团队新框架，可显著提升代码准确性与执行效率

代码模型SFT对齐后，缺少进一步偏好学习的问题有解了。北大李戈教授团队与字节合作，在模型训练过程中引入偏好学习，提出了一个全新的代码生成优化框架——CodeDPO。

来自主题: AI技术研报

8676 点击 2024-11-27 14:35

1行代码改进大模型训练，Llama训练速度提升至1.47倍，全华人团队出品

只要改一行代码，就能让大模型训练效率提升至1.47倍。

来自主题: AI技术研报

7243 点击 2024-11-27 14:25

微软发现不同prompt模版会导致最大40%性能差距！

这篇文章研究了提示格式对大型语言模型（LLM）性能的影响。

来自主题: AI技术研报

6889 点击 2024-11-27 13:48

微软、OpenAI最新发布：从吴恩达教授推荐的Medprompt到o1的技术演进

近期，微软研究团队发布了一项重要的研究成果，揭示了AI推理能力从传统的提示工程方法（如Medprompt）到原生推理机制（如OpenAI的o1）演进的全貌。此项研究为正在开发AI产品的朋友们提供了宝贵的技术洞察。本文将详细分析这一研究的过程和结论，探讨其对AI推理领域及产品开发的深远影响。

来自主题: AI技术研报

7238 点击 2024-11-27 09:25

微软将推出LazyGraphRAG，索引成本降低至GraphRAG的千分之一！｜抢先解读

将知识图谱技术与RAG有机结合的GraphRAG可谓是今年下半年来的LLM应用领域的一个热点，借助大模型从非结构化文本数据创建知识图谱与摘要，并结合图与向量索引技术来提高对复杂用户查询的检索增强与响应质量。

来自主题: AI技术研报

9351 点击 2024-11-26 18:01

Claude化身服务器联通一切！AI写好代码自己发Github，人类程序员只配动嘴了

Anthropic又发大礼包！现在Claude自己就是一台服务器。

来自主题: AI技术研报

9399 点击 2024-11-26 17:12

空间智能新进展：教机器人组装宜家家具，首次实现操作步骤与真实视频对齐 | NeurIPS

斯坦福吴佳俊团队，给机器人设计了一套组装宜家家具的视频教程！

来自主题: AI技术研报

8765 点击 2024-11-26 16:58

吴恩达开源大模型套件：11个模型平台一种方式调用，已获星标超1.2K

吴恩达发布的开源大模型套件aisuite，不到半天就斩获了1200+星标。

来自主题: AI技术研报

10251 点击 2024-11-26 16:47

超越GPT-4o！开源科研神器登场，4500万篇论文检索增强生成靠谱回答

只需几秒钟，开源模型检索4500篇论文，比GPT-4o还靠谱！

来自主题: AI技术研报

10763 点击 2024-11-26 16:34

「学术版ChatGPT」登场！Ai2打造科研效率神器OpenScholar，让LLM帮你搞定文献综述

Ai2和华盛顿大学联合Meta、CMU、斯坦福等机构发布了最新的OpenScholar系统，使用检索增强的方法帮助科学家进行文献搜索和文献综述工作，而且做到了数据、代码、模型权重的全方位开源。

来自主题: AI技术研报

7152 点击 2024-11-26 14:05

UC伯克利：给大模型测MBTI，Llama更敢说但GPT-4像理工男

如果给LLM做MBTI，会得到什么结果？UC伯克利的最新研究就发现，不同模型真的有自己独特的性格

来自主题: AI技术研报

7820 点击 2024-11-26 13:59

撞墙还是新起点？自回归模型在图像领域展现出Scaling潜力

自回归方法，在图像生成中观察到了 Scaling Law。「Scaling Law 撞墙了？」这恐怕是 AI 社区最近讨论热度最高的话题。

来自主题: AI技术研报

6745 点击 2024-11-26 13:48

揭示Transformer「周期建模」缺陷！北大提出新型神经网络FAN，填补周期性特征建模能力缺陷

北京大学研究团队开发的FAN模型能有效捕捉数据中的周期性模式，相比传统模型在多项任务中表现出色，同时降低了参数量和计算量，增强了对周期性特征的建模能力，应用潜力广泛。

来自主题: AI技术研报

6829 点击 2024-11-26 13:43

炸裂！Anthropic 重磅开源「模型上下文协议」MCP，LLM 应用要变天, AGI真的近了

各位大佬，激动人心的时刻到啦！Anthropic 开源了一个革命性的新协议——MCP（模型上下文协议），有望彻底解决 LLM 应用连接数据难的痛点！它的目标是让前沿模型生成更好、更相关的响应。以后再也不用为每个数据源写定制的集成代码了，MCP 一个协议全搞定！

来自主题: AI技术研报

11062 点击 2024-11-26 11:06

AI搜索公司，仅成立2年，为什么估值超600亿？7000字长文解析AI搜索未来的五大趋势

今天我们就来看看AI搜索赛道为什么能跑出估值超600亿的独角兽？

来自主题: AI技术研报

7877 点击 2024-11-26 09:27

大LLM输出就一定好吗，LLM嵌入用于回归任务，斯坦福和谷歌最新突破性发现与实践指南

在人工智能领域，大语言模型（LLM）的向量嵌入能力一直被视为处理文本数据的利器。然而，斯坦福大学和Google DeepMind的研究团队带来了一个颠覆性发现：LLM的向量嵌入能力可以有效应用于回归任务。

来自主题: AI技术研报

7170 点击 2024-11-26 09:04

文本、图像、点云任意模态输入，AI能够一键生成高质量CAD模型了

该项目由忆生科技联合香港大学、上海科技大学共同完成，是全球首个同时支持文本描述、图像、点云等多模态输入的计算机辅助设计（CAD）生成大模型。

来自主题: AI技术研报

9081 点击 2024-11-25 15:51

指令跟随大比拼！Meta发布多轮多语言基准Multi-IF：覆盖8种语言，超4500种任务

Meta全新发布的基准Multi-IF涵盖八种语言、4501个三轮对话任务，全面揭示了当前LLM在复杂多轮、多语言场景中的挑战。所有模型在多轮对话中表现显著衰减，表现最佳的o1-preview模型在三轮对话的准确率从87.7%下降到70.7%；在非拉丁文字语言上，所有模型的表现显著弱于英语。

来自主题: AI技术研报

7847 点击 2024-11-25 15:45

智能体竟能自行组建通信网络，还能自创协议提升通信效率

Hugging Face 上的模型数量已经超过了 100 万。但是几乎每个模型都是孤立的，难以与其它模型沟通。尽管有些研究者甚至娱乐播主试过让 LLM 互相交流，但所用的方法大都比较简单。

来自主题: AI技术研报

6475 点击 2024-11-25 14:46