多模态长文档新基准来了!20多项任务覆盖理解推理定位,GPT-4o也就刚及格
多模态长文档新基准来了!20多项任务覆盖理解推理定位,GPT-4o也就刚及格GPT-4o仅得分64.5,其余模型均未及格! 全面、细粒度评估模型多模态长文档理解能力的评测集来了~ 名为LongDocURL,集成了长文档理解、数值推理和跨元素定位三个主任务,并包含20个细分子任务。
搜索
GPT-4o仅得分64.5,其余模型均未及格! 全面、细粒度评估模型多模态长文档理解能力的评测集来了~ 名为LongDocURL,集成了长文档理解、数值推理和跨元素定位三个主任务,并包含20个细分子任务。
a16z 合伙人 Jennifer Li 最近分享了她对生成式 AI 的最新见解,特别提到了设备端运行的小型模型在未来的重要性。
12月31日,上海高级别自动驾驶引领区数据采集车发车仪式在上海浦东举行,30辆全新的智己L6数据采集车盛装列队并集中发车。上海正谋划打造人工智能“模塑申城”,建设高级别自动驾驶引领区,按照“单车智能为基础,车路云协同为关键支撑”技术路线,持续推动上海智能网联汽车产业生态培育。
OpenAI发布旗舰推理模型o3和o3-mini,成为他们2024年的收官之作,制造了一波小热潮。和往常一样,Twitter (x.com)依然是外网讨论的主阵地。
2024年12月31日,阿里云宣布2024年度第三轮大模型降价,通义千问视觉理解模型全线降价超80%。
2024年,所有的3C数码新品基本都绕不开“AI”这个词,更具体地说,是绕不开AI大模型。而反过来说,AI大模型也脱离不了硬件,毕竟任何新产品都绕不开3个质问:落地场景究竟是什么,怎么样被市场接受,和怎么赚钱。
奥特曼说,Sora代表了视频生成大模型的GPT-1时刻。
没有GPU Poor,只有卷得不够多。 DeepSeek-V3的横空出世,用一组惊人的数据完美诠释了这句话。
基于大模型的产业级AI应用服务商明心数智获得近2亿元的B轮融资,本轮由柏睿资本领投,国方创新、狮城资本和老股东鼎晖VGC跟投,华兴资本担任独家财务问。
想象一下,走进一家餐厅,迎接你的不是服务员,而是一个智能AI助手。这不是科幻小说,这是现实。全球首个AI餐厅已经诞生,它能够提供高达270万种不同的菜品和酒水组合建议。 这家餐厅的背后,是大模型平台Brown Bacon AI与意大利餐厅Cibo Vino的合作结晶。