大模型常用评测基准汇总
大模型常用评测基准汇总基于评测维度,考虑到各评测集关注的评测维度,可以将其划分为通用评测基准和具体评测基准。
来自主题: AI资讯
14689 点击 2024-07-23 19:24
搜索
基于评测维度,考虑到各评测集关注的评测维度,可以将其划分为通用评测基准和具体评测基准。
难度大升级的多任务长视频理解评测基准MLVU来了!
作为连接人类与大模型的桥梁,大模型对 「Prompt (提示词)」 究竟有多敏感?同样的prompt,可能写错个单词、写法不一样,都会出现不一样的结果。