LLMEval是由復旦大學NLP實驗室推出的大模型評測基準,最新的LLMEval-3聚焦於專業知識能力評測,涵蓋哲學、經濟學、法學、教育學、文學、歷史學、理學、工學、農學、醫學、軍事學、管理學、藝術學等教育部劃定的13個學科門類、50餘個二級學科,共計約20W道標準生成式問答題目。
數據統計
相關導航
暫無評論...
LLMEval是由復旦大學NLP實驗室推出的大模型評測基準,最新的LLMEval-3聚焦於專業知識能力評測,涵蓋哲學、經濟學、法學、教育學、文學、歷史學、理學、工學、農學、醫學、軍事學、管理學、藝術學等教育部劃定的13個學科門類、50餘個二級學科,共計約20W道標準生成式問答題目。