Today(※最近) I Learned です。 といっても全然うまくいっていません 目次 目次 AutoModelForCausalLM.from_pretrainedの引数 attn_implementation引数のデフォルト値 attn_implementation="eager"(訓練できる) attn_implementation="sdpa"かつ、Flash Attention 1(No available kernel) attn_implementation="flash_attention_2"(宿題) Flash Attentionの実装が重複してる感 積ん読 AutoM…