自然言語処理におけるTransformerの応用

このタグの解説について

この解説文は、すでに終了したサービス「はてなキーワード」内で有志のユーザーが作成・編集した内容に基づいています。その正確性や網羅性をはてなが保証するものではありません。問題のある記述を発見した場合には、お問い合わせフォームよりご連絡ください。

エビデンスで教育を考えた•1年前

コンペメモ（次元512を超えてしまうので、、）〜The Learning Agency Lab - PII Data Detection⑤〜

Transformerモデルの概要と仕組み的にはTransformerモデルが512トークンの制限を持つ場合、テキストの長さがその制限を超える場合には、テキストを複数の部分に分割する必要があります。これを行う一般的な方法の1つは、テキストを重複しないようにオーバーラップしながら512トークンごとに分割することです。以下のコードは分割するためのコード。 # テキストを512トークンごとに分割する関数 def split_text(text, max_tokens=512): # テキストの長さ text_length = len(text) # 分割されたテキストのリスト split_texts…

#機械学習#自然言語処理におけるTransformerの応用

関連ブログ

コンペメモ（次元512を超えてしまうので、、）〜The Learning Agency Lab - PII Data Detection⑤〜

関連ブログ