
C-Eval
一个适用于大语言模型的多层次多学科中文评估套件
PubMedQA是一个生物医学研究问答数据集,包含了1K专家标注,61.2K 个未标注和 211.3K 个人工生成的QA实例,该排行榜目前已收录18个模型的医学测试得分。
本站ie111提供的PubMedQA都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由ie111实际控制,在2024年2月17日 18:01收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,ie111不承担任何责任。







