AI模型评测

共 9 篇网址

软件工具探索发现常用网站娱乐休闲界面设计设计拓展素材资源网页灵感 LOGO设计模板方案码农俱乐部图标下载配色方案字体设计高清图库生活服务视频直播网盘工具知识学习热点数据设计公司设计神器设计灵感字体下载学习平台文案神器二维码工具 AI聊天对话 PPT 字体工具 UI JH 代码美化数据挖掘脑图/流程图协作/效率在线帮手前端后端在线手册开源框架开发工具教程学习 JDK和平台内容媒体资讯/圈子配音软件 H5场景数据收集数据服务礼品代发 B2B电商平台 AI智能写作常用AI图像工具 AI图片插画生成 AI图片优化修复 AI图片无损放大 AI图片背景移除 AI视频工具 AI幻灯片和演示 AI表格数据处理 AI文档工具 AI效率提升 AI设计工具 AI编程工具 AI音频工具 AI语言翻译 AI内容检测 AI提示指令 AI训练模型 AI模型评测 AI学习网站 AI开发框架剪辑软件 AI热门集合

排序

发布更新浏览点赞

PubMedQA

生物医学研究问答数据集和模型得分排行榜

05,1200

HELM

斯坦福大学推出的大模型评测体系

05,6810

AI模型评测 # 大模型评测

H2O EvalGPT

H2O推出的基于Elo评级方法的LLM评估系统和工具

04,9190

CMMLU

一个综合性的大模型中文评估基准

05,0210

FlagEval

智源研究院推出的FlagEval（天秤）大模型评测平台

05,0590

OpenCompass

上海人工智能实验室推出的大模型开放评测体系

05,2420

C-Eval

一个适用于大语言模型的多层次多学科中文评估套件

04,7110

MMLU

大规模多任务语言理解基准，UC Berkeley推出

05,4580

SuperCLUE

中文通用大模型综合性评测基准

04,6100