LLMにチェスをプレイさせるとどれくらい強いのか、という話題で興味深い記事があった。その記事の内容と私が追試した結果についてメモしておきたい。 参考にした記事 GIGAZINEの記事によると、『大規模言語モデルをチェスの標準的なAIと対戦させた結果、多くの大規模言語モデルが惨敗する中、「gpt-3.5-turbo-instruct」だけが好成績を残した』とのことである。もちろんStockfishのスキルレベルは最も弱いレベルにしているが、Stockfishのレベルをある程度上げても「gpt-3.5-turbo-instruct」は勝利できたと報告されている。 なぜ「gpt-3.5-turbo-…