富岳で学習した大規模言語モデル Fugaku-LLM 先週末に「富岳」で学習した大規模言語モデル「Fugaku-LLM」のニュースが流れました。富岳を一月ばかり占有して GTP-2 で学習したもののようです。GTP-2 ではしょぼいような気もしますが、公開モデルなのでありかなと思います。 pr.fujitsu.com Hugging Face にモデルも公開されました。 huggingface.co 週末にローカルで動かしてみる試みがされていたので、以下のサイトを真似させていただくことにします。ただし Docker は使わずに済ませます。 zenn.dev モデルサイズが 11Gbyte ほど…