AI模型評測

LLMEval3

LLMEval是由復旦大學NLP實驗...

標籤:

LLMEval是由復旦大學NLP實驗室推出的大模型評測基準,最新的LLMEval-3聚焦於專業知識能力評測,涵蓋哲學、經濟學、法學、教育學、文學、歷史學、理學、工學、農學、醫學、軍事學、管理學、藝術學等教育部劃定的13個學科門類、50餘個二級學科,共計約20W道標準生成式問答題目。

數據統計

相關導航

暫無評論

暫無評論...