C-Eval

C-Eval

C-Eval是一個適用於大語言模...

標籤：AI模型評測

打開網站手機打開

C-Eval是一個適用於大語言模型的多層次多學科中文評估套件，由上海交通大學、清華大學和愛丁堡大學研究人員在2023年5月份聯合推出，包含了13948個多項選擇題，涵蓋了52個不同的學科和四個難度級別，用以評測大模型中文理解能力。

數據統計

相關導航

LLMEval是由復旦大學NLP實驗...

MMLU 全稱 Massive Multitask...

Chatbot Arena

Chatbot Arena是一個大型語言...

FlagEval（天秤）由智源研究...

CMMLU是一個綜合性的中文評估...

HELM全稱Holistic Evaluation...

暫無評論

暫無評論...