データ拡張

このタグの解説について

この解説文は、すでに終了したサービス「はてなキーワード」内で有志のユーザーが作成・編集した内容に基づいています。その正確性や網羅性をはてなが保証するものではありません。問題のある記述を発見した場合には、お問い合わせフォームよりご連絡ください。

ローカルLLM自由帳•1年前

【LLM論文を読む】テキスト分類のためのデータ拡張（Data Augmentation）

LLMに知識を追加するためのファインチューン手法を調べていたところ、限られたデータセットを量的に拡張する「データ拡張/Data Augmentation」という研究領域があることを知りました。簡単に見てみると、データ拡張はテキストAIよりも画像AI・音声AIなどの分野で先行して注目されてきたそうです。例えば「画像データの左右を反転させてデータ数を2倍にする」などStableDiffusionのLoRA学習でお馴染みの方法も、一種のデータ拡張と位置付けられるようです。今回は言語モデルの学習におけるデータ拡張について知りたかったので、以下のサーベイ論文を斜め読みしてみました。 arxiv.o…

#LLM#データ拡張#Data augmentation

関連ブログ

PyDocument•2年前

機械学習におけるデータ拡張（Data Augmentation）とその実践（Pythonによる実装）

機械学習モデルの性能向上に不可欠なデータ拡張（Data Augmentation）について、基本的な考え方から具体的な手法、Pythonでの実装例までを解説します。ここでは、理論と実践の両面からデータ拡張を理解することを目的とします。データ拡張とはデータ拡張の必要性補足: ロバスト性データ拡張の具体的な手法画像データのデータ拡張テキストデータのデータ拡張音声データのデータ拡張 Pythonによるデータ拡張の実装例画像データのデータ拡張 (ImageDataGenerator)の例テキストデータのデータ拡張 (NLTK)の例データ拡張の注意点まとめデータ拡張とはデータ…

#機械学習#Python#データ拡張

ビジネスパーソン・ガジェット置場　empty lot for business•3年前

Pyrhon：Pillowを利用したデータの拡張用コード（オフライン拡張）

備忘録です。今回はPillowを利用してデータを拡張する際のコードです。

#PIL#画像分類#データ拡張

takuroooのブログ•5年前

Random Erasingの動きを見てみる

＊この記事は以前Qiitaで書いたものです。 qiita.com 目次目次概要 Random Erasingとはアルゴリズムアルゴリズムの流れ RandomErasingのパラメータをいじって結果の変化を可視化する概要データ拡張の一つであるRandom Erasingの処理を説明する記事論文の内容は以下の記事で別にまとめています。 takuroooooo.hatenablog.com Random Erasingとは 2017年に発表されたデータ拡張。 Random Erasing Data Augmentation 画像上に矩形を重畳することでデータの水増しを行う。実装が簡単…

#Python#機械学習#DeepLearning#データ拡張#RandomErasing

yoko's memo•1年前

機械学習におけるデータ拡張とその効果

機械学習の分野では、データがモデルの性能に大きな影響を与えます。しかし、多くの場合、データの量や質が不十分であることが課題となります。そこで、データ拡張という手法が活用されます。この記事では、データ拡張の概念とその効果について解説します。 moun45.hatenablog.com データ拡張とはデータ拡張は、既存のデータセットを変換し、新たなデータを合成する手法です。主な目的は、データのバリエーションを増やし、モデルの汎化性能を向上させることです。具体的には、画像データの回転、反転、クロップ、明るさの変更などの操作が一般的です。自然言語処理の場合、文章の単語の置換、削除、挿入などが行われま…

#機械学習#データ拡張#効果