data collator

このタグの解説について

この解説文は、すでに終了したサービス「はてなキーワード」内で有志のユーザーが作成・編集した内容に基づいています。その正確性や網羅性をはてなが保証するものではありません。問題のある記述を発見した場合には、お問い合わせフォームよりご連絡ください。

nikkie-ftnextの日記•2年前

trlのSFTTrainerの実装を覗き、初期化時にtokenizerやdata collatorがどのように設定されるかを理解する

はじめにﾌｳｶﾁｬﾝ😭1 nikkieです。 trlというライブラリを使ったLLMのファインチューンのチュートリアルに過去に取り組みました。その中で、自然言語のドキュメントではどうも細かい点が明確に分かりづらく、実装を見るのが手っ取り早そうと感じ始めました。そこで今回は、データセットのテキストがどのようにトークンID列に変換されるか（＝エンコーディングされるか）に絞って見ていきます。目次はじめに目次 Gemmaのファインチューン SFTTrainerはどんなtokenizerを持つのか？ SFTTrainerはどんなdata collatorを持つのか？ SFTTrainerが持つ…

#trl#SFTTrainer#ソースコードリーディング#トークナイザー#data collator

関連ブログ

nikkie-ftnextの日記•2年前

transformersのdata collator、何するものぞ？

はじめにピーーーーーーー。1nikkieです。 transformersを使ったLLMのファインチューニング（SFT）のコードを最近眺めているのですが、data collatorという概念がよく分かっていません。 1日1エントリを使って調べてみます。目次はじめに目次 transformersのTrainerに渡すdata_collator 資料をあたっていく Hugging Face NLP Course 『大規模言語モデル入門』簡単な例を動かす data collatorには種類がある終わりに transformersのTrainerに渡すdata_collator かつて写経し…

#data collator