こんにちは。SB Intuitions で LLM の評価を担当している 岡 照晃、柴田 知秀 です。 本記事では我々が構築・公開した日本語のベンチマーク『JamC-QA(Japanese Multiple Choice QA, ジャムシーキューエー)』[岡+, 25]を紹介します。 JamC-QA は日本固有の知識(e.g., 日本の文化、風習、...)を問う質問応答ベンチマークです。 問題形式は JCommonsenseQA [栗原+, 23] や JMMLU といった既存のベンチマークと同じ多肢選択式ですが、 難度はそれらより高く、 下記の評価結果を見ても、JamC-QA ではスコアが一…