PubMedQA

PubMedQA

PubMedQA是一個生物醫學研究...

標籤：AI模型評測

打開網站手機打開

PubMedQA是一個生物醫學研究問答數據集，包含了1K專家標註，61.2K 個未標註和 211.3K 個人工生成的QA實例，該排行榜目前已收錄18個模型的醫學測試得分。

數據統計

相關導航

CMMLU是一個綜合性的中文評估...

C-Eval是一個適用於大語言模...

SuperCLUE 是一個中文通用大...

MagicArena是什麼 MagicArena...

OpenCompass

OpenCompass是由上海人工智能...

Chatbot Arena

Chatbot Arena是一個大型語言...

暫無評論

暫無評論...