はじめに前回「CyberAgentLM3-22B-Chat」や「Llama-3-ELYZA-JP-8B」で同じことをしました。 touch-sp.hatenablog.com touch-sp.hatenablog.com 今回は「gemma-2-9b-it」です。 小規模でかつ日本語特化モデルでないにもかかわらず日本語性能は高い印象です。モデルの量子化今回は量子化を行いませんでした。Gradioで実行 import gradio as gr from transformers import AutoModelForCausalLM, AutoTokenizer, TextIteratorSt…