C-Eval是一個適用於大語言模...
C-Eval是一個適用於大語言模型的多層次多學科中文評估套件,由上海交通大學、清華大學和愛丁堡大學研究人員在2023年5月份聯合推出,包含了13948個多項選擇題,涵蓋了52個不同的學科和四個難度級別,用以評測大模型中文理解能力。
Open LLM Leaderboard 是最大...
H2O EvalGPT 是 H2O.ai 用於...
LLMEval是由復旦大學NLP實驗...
HELM全稱Holistic Evaluation...
CMMLU是一個綜合性的中文評估...
AI Ping是什麼 AI Ping是專注...