はじめに「stable-code-3b」という大規模言語モデルは以前から公開されていました。 今回「instruct」モデルが新たに公開されたので使ってみました。私の認識が間違えていなかったら「instruct」モデルは質問に答えてくれるモデルです。通常の大規模言語モデルは最初の数単語を渡して続きを書いてくれます。そのモデルに追加学習して質問や指示に答えてくれるようにしたのが「instruct」モデルです。質問文(または指示文)を理解して返答する必要があるので通常モデルよりやや複雑だと思います。その他に会話ができる「chat」モデルというのもあったりします。たぶん会話の内容を記憶しながら質問に…