AI资讯新闻榜单内容搜索-向量空间

Google放大招：文字、图片、视频、音频、PDF，全部压进同一个向量空间！Gemini Embedding 2正式GA

Google悄悄干了一件大事——Gemini Embedding 2正式进入GA阶段，成为Gemini API中第一个原生多模态embedding模型。它能把文本、图片、视频、音频、PDF文档全部映射进同一个统一向量空间，支持100多种语言。

来自主题: AI资讯

10730 点击 2026-05-02 15:05

从多模态大模型中「拆」出音频向量模型

Google 最近发了 Gemini Embedding 2，他们第一个原生多模态向量模型。文本、图像、视频、音频、文档，全部映射到同一个 3072 维向量空间。这是 Omni Embedding（全模态向量模型）的大趋势：一个架构吃下所有模态，从 jina-embeddings-v4 到 Omni-Embed-Nemotron 再到 Omni-5，大家都在往这个方向收敛。

来自主题: AI技术研报

6128 点击 2026-03-16 15:06

谷歌AGI底座降临！首个原生全模态嵌入模型上线，已实现全模态SOTA

谷歌发布首个原生全模态 Embedding 模型 Gemini Embedding 2！它将文本、图、音视频及 PDF 无损融于统一向量空间，实现跨越五大模态的直接检索。这极大降低了架构成本，赋予了 AI 真正连贯的「记忆」，是重塑 AI 基建的里程碑。

来自主题: AI资讯

9569 点击 2026-03-12 10:21

转 | 当 Vector Database 还不是主流时，这家公司（Zilliz）看见了未来

不久前，Zilliz 研发VP栾小凡受邀做客英文播客节目Innovator Coffee，深度分享了 Zilliz 的创业历程、Milvus 产品的构建逻辑与核心设计思路，以下为本次分享的重点内容摘编。

来自主题: AI资讯

7107 点击 2026-01-06 09:48

Embedding黑箱成为历史！这个新框架让模型“先解释，再学Embedding”

让模型先解释，再学Embedding！来自UIUC、ANU、港科大、UW、TAMU等多所高校的研究人员，最新推出可解释的生成式Embedding框架——GRACE。过去几年，文本表征（Text Embedding）模型经历了从BERT到E5、GTE、LLM2Vec，Qwen-Embedding等不断演进的浪潮。这些模型将文本映射为向量空间，用于语义检索、聚类、问答匹配等任务。

来自主题: AI技术研报

8542 点击 2025-10-22 15:00