让「幻觉」无处遁形!谷歌DeepMind全新基准,三代Gemini同台霸榜
让「幻觉」无处遁形!谷歌DeepMind全新基准,三代Gemini同台霸榜谷歌推出的FACTS Grounding基准测试,能评估AI模型在特定上下文中生成准确文本的能力,有助于提升模型的可靠性;通过去除不满足用户需求的回复,确保了评分的准确性和模型排名的公正性。
来自主题: AI技术研报
9854 点击 2025-01-13 13:47
搜索
谷歌推出的FACTS Grounding基准测试,能评估AI模型在特定上下文中生成准确文本的能力,有助于提升模型的可靠性;通过去除不满足用户需求的回复,确保了评分的准确性和模型排名的公正性。
目标检测领域,迎来了新进展—— Grounding DINO 1.5,IDEA研究院团队出品,在端侧就可实现实时识别。
字节&复旦大学多模态理解大模型来了:可以精确定位到视频中特定事件的发生时间。