武大等发布大型视觉语言模型最新安全综述:全面分类攻击策略、防御机制和评估方法
武大等发布大型视觉语言模型最新安全综述:全面分类攻击策略、防御机制和评估方法武汉大学等发布了一篇大型视觉语言模型(LVLMs)安全性的综述论文,提出了一个系统性的安全分类框架,涵盖攻击、防御和评估,并对最新模型DeepSeek Janus-Pro进行了安全性测试,发现其在安全性上存在明显短板。
搜索
武汉大学等发布了一篇大型视觉语言模型(LVLMs)安全性的综述论文,提出了一个系统性的安全分类框架,涵盖攻击、防御和评估,并对最新模型DeepSeek Janus-Pro进行了安全性测试,发现其在安全性上存在明显短板。
为什么必须像评估劳动力一样评估LLM代理,而不仅仅是评估软件。
本文介绍了一项突破性的AI推理技术创新——思维草图(SoT)框架。该框架从人类认知过程中获取灵感,通过一个200M大小的路由模型将LLM引导到概念链、分块符号化和专家词汇三种推理范式,巧妙地解决了大语言模型推理过程中的效率瓶颈。
在 ICLR 2025 中,来自南洋理工大学 S-Lab、上海 AI Lab、北京大学以及香港大学的研究者提出的基于 Flow Matching 技术的全新 3D 生成框架 GaussianAnything,针对现有问题引入了一种交互式的点云结构化潜空间,实现了可扩展的、高质量的 3D 生成,并支持几何-纹理解耦生成与可控编辑能力。
自 2025 年伊始,Cursor、WindSurf、Trae 等 Agentic AI 编程工具开始席卷开发领域。然而与过往的 GenAI 技术类似,这些 Agentic AI 技术同样面临着小规模 demo 惊艳,产品化实战翻车的困境——它们生成一两千行的小型原型轻而易举。自我迭代、自动 Debug、快速交付,整个过程行云流水。
北京时间3月10日,彭博科技报道称,ServiceNow公司接近达成收购人工智能公司Moveworks的交易,交易价格接近30亿美元。
ChatGPT 平地一声雷,打乱了很多人、很多行业的轨迹和节奏。这两年模型发布的数量更是数不胜数,其中文本大模型就占据了 AIGC 赛道的半壁江山。关注我的家人们永远都是抢占 AI 高地的冲锋者。
随着推理模型能力提升,本周Agent也进入刷屏周。
2024 年 9 月 22 日,三位年少有为怀揣创业理想的有志青年,来到了特工宇宙杭州线下办公室,一起交流 AI 搜索的技术和未来。
Magma是一个新型多模态基础模型,能够理解和执行多模态任务,适用于数字和物理环境:通过标记集合(SoM)和标记轨迹(ToM)技术,将视觉语言数据转化为可操作任务,显著提升了空间智能和任务泛化能力。