最低调“六小虎”阶跃星辰开年首秀:Agent落地智能终端,印奇也来了|最前线
最低调“六小虎”阶跃星辰开年首秀:Agent落地智能终端,印奇也来了|最前线回应DeepSeek,阶跃星辰亮出“三件套”:开源,多模态推理,AI Agent。
来自主题: AI资讯
7999 点击 2025-02-22 13:26
搜索
回应DeepSeek,阶跃星辰亮出“三件套”:开源,多模态推理,AI Agent。
近日,微软和剑桥大学公布推理新方法:多模态思维可视化MVoT。新方法可以边推理,边「想象」,同时利用文本和图像信息学习,在实验中比CoT拥有更好的可解释性和稳健性,复杂情况下甚至比CoT强20%。还可以与CoT组合,进一步提升模型性能。
QVQ 在人工智能的视觉理解和复杂问题解决能力方面实现了重大突破。在 MMMU 评测中,QVQ 取得了 70.3 的优异成绩,并且在各项数学相关基准测试中相比 Qwen2-VL-72B-Instruct 都有显著提升。通过细致的逐步推理,QVQ 在视觉推理任务中展现出增强的能力,尤其在需要复杂分析思维的领域表现出色。
北大等出品,首个多模态版o1开源模型来了—— 代号LLaVA-o1,基于Llama-3.2-Vision模型打造,超越传统思维链提示,实现自主“慢思考”推理。 在多模态推理基准测试中,LLaVA-o1超越其基础模型8.9%,并在性能上超越了一众开闭源模型。