OpenCompass是由上海人工智能...
OpenCompass是由上海人工智能實驗室(上海AI實驗室)於2023年8月正式推出的大模型開放評測體系,通過完整開源可復現的評測框架,支持大語言模型、多模態模型各類模型的一站式評測,並定期公佈評測結果榜單。
SuperCLUE 是一個中文通用大...
H2O EvalGPT 是 H2O.ai 用於...
MMBench是一個多模態基準測試...
CMMLU是一個綜合性的中文評估...
LLMEval是由復旦大學NLP實驗...
MMLU 全稱 Massive Multitask...