音频-视觉全模态的未来预测,FutureOmni给出了首份答卷
音频-视觉全模态的未来预测,FutureOmni给出了首份答卷复旦大学、上海创智学院与新加坡国立大学联合推出首个全模态未来预测评测基准 FutureOmni,要求模型从音频 - 视觉线索中预测未来事件,实现跨模态因果和时间推理。
来自主题: AI技术研报
5862 点击 2026-01-26 10:19
搜索
复旦大学、上海创智学院与新加坡国立大学联合推出首个全模态未来预测评测基准 FutureOmni,要求模型从音频 - 视觉线索中预测未来事件,实现跨模态因果和时间推理。