C-Eval 中文大模型权威排名公布!APUS 得分名列第四,难题排名全球第一!
2023-07-24 16:58
Web3 笔记
2023-07-24 16:58
Web3 笔记
2023-07-24 16:58
订阅此专栏
收藏此文章
图片来源自网络

本文全文 172 字,仔细阅读需要 3 分钟

C-Eval 全球大模型综合性考试评测榜公布,全球排名前四的分别为清华智谱的 ChatGLM2、OpenAI 的 GPT-4、商汤的 SenseChat, APUS 的 AiLMe-100B v1。然而值得关注的是,在难题排行榜中,APUS 位列全球榜首!

                      

C-Eval 是由清华大学、上海交通大学和爱丁堡大学合作构建的面向中文语言模型的综合性考试评测集,包含 13948 道多项选择题,涵盖 52 个不同学科和四个难度级别。

编辑丨 WEB3 笔记  编辑部
W


WEB3 笔记
读者群添加
VX:web3bj


【免责声明】市场有风险,投资需谨慎。本文不构成投资建议,用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

Web3 笔记
数据请求中
查看更多

推荐专栏

数据请求中
在 App 打开