AI资讯新闻榜单内容搜索-评测基准

大模型常用评测基准汇总

基于评测维度，考虑到各评测集关注的评测维度，可以将其划分为通用评测基准和具体评测基准。

来自主题: AI资讯

14689 点击 2024-07-23 19:24

难度大升级的多任务长视频理解评测基准MLVU来了！

来自主题: AI技术研报

10400 点击 2024-06-21 20:21

作为连接人类与大模型的桥梁，大模型对「Prompt (提示词)」究竟有多敏感？同样的prompt，可能写错个单词、写法不一样，都会出现不一样的结果。

来自主题: AI技术研报

9491 点击 2023-12-27 14:30