ie111
关于我们
  • 首页
  • blog
  • 资源
  • 热榜
  • 关于
    • 站点公告
    • 留言反馈
    • 投稿收录
    • 进群交流
    • 关于我们
  • 媒介
    • 微博
    • B站
    • 知乎
    • 语雀
    • 花瓣
    • 乐乎
      • 未登录
        登录后即可体验更多功能
      未登录
      登录后即可体验更多功能

      AI模型评测

      共 9 篇网址
      软件工具探索发现常用网站娱乐休闲界面设计设计拓展素材资源网页灵感LOGO设计模板方案码农俱乐部图标下载配色方案字体设计高清图库生活服务视频直播网盘工具知识学习热点数据设计公司设计神器设计灵感字体下载学习平台文案神器二维码工具AI聊天对话PPT字体工具UIJH代码美化数据挖掘脑图/流程图协作/效率在线帮手前端后端在线手册开源框架开发工具教程学习JDK和平台内容媒体资讯/圈子配音软件H5场景数据收集数据服务礼品代发B2B电商平台AI智能写作常用AI图像工具AI图片插画生成AI图片优化修复AI图片无损放大AI图片背景移除AI视频工具AI幻灯片和演示AI表格数据处理AI文档工具AI设计工具AI编程工具AI音频工具AI语言翻译AI内容检测AI提示指令AI训练模型AI模型评测AI学习网站AI开发框架剪辑软件AI热门集合
      排序
      发布更新浏览点赞
      PubMedQA

      PubMedQA

      生物医学研究问答数据集和模型得分排行榜
      04,5670
      AI模型评测
      HELM

      HELM

      斯坦福大学推出的大模型评测体系
      05,0100
      AI模型评测# 大模型评测
      H2O EvalGPT

      H2O EvalGPT

      H2O推出的基于Elo评级方法的LLM评估系统和工具
      04,3030
      AI模型评测
      CMMLU

      CMMLU

      一个综合性的大模型中文评估基准
      04,4730
      AI模型评测
      FlagEval

      FlagEval

      智源研究院推出的FlagEval(天秤)大模型评测平台
      04,4300
      AI模型评测
      OpenCompass

      OpenCompass

      上海人工智能实验室推出的大模型开放评测体系
      04,4510
      AI模型评测
      C-Eval

      C-Eval

      一个适用于大语言模型的多层次多学科中文评估套件
      03,9780
      AI模型评测
      MMLU

      MMLU

      大规模多任务语言理解基准,UC Berkeley推出
      04,8690
      AI模型评测
      SuperCLUE

      SuperCLUE

      中文通用大模型综合性评测基准
      03,9750
      AI模型评测
      没有了
      ie111
      浏览器主页_ie111导航,互联网聚合资源上网主页。效率工作,利他精神,收录并分享互联网价值信息、实用网址、工具、素材、软件、资源等。

      友链申请 免责声明 广告合作 关于我们

      关注公众号ie111
      关注公众号
      扫码加微信ie111
      扫码加微信
      Copyright © 2026 ie111导航  ICP:湘ICP备15019639号-4  Design by LeiCheng  ·图片存储服务又拍云  ·服务器提供商腾讯云  
      反馈
      让我们一起共建文明社区!您的反馈至关重要!
      网址
      网址文章软件书籍