生成AIが、大盛り上がりなのに、GANは最近一切聞きません。 GAN(Generative Adversarial Networks)は、なぜ、廃れたか? GANが廃れた理由 GANが廃れた理由を2つ示します。 『モード崩壊』 以下の記事がわかり易いですが、GANは、『モード崩壊』という課題を抱えています。 qiita.com 引用: モード崩壊は、訓練中のGANがデータセットの多様性全体を捉えることができず、限られた数のサンプルまたは非常に似ているサンプルのみを生成するときに発生する問題を指します。 それに比して、生成AIは、拡散モデルで、以下の通り大丈夫。 引用: 拡散モデルがモード崩壊し…
【初心者向け】ComfyUIのインストールから画像生成までの手順 の続きです。前回はComfyUIのインストールとサンプルの画像生成を行いました。 今回は、画像生成の設定について色々説明していきたいと思います。使えることをメインにしますので細かい設定や難しい話は無しでいきます。 目次 ComfyUIの起動 プロンプトの変更 ポジティブプロンプトの変更 ネガティブプロンプトの変更 モデルの変更 1. モデルのダウンロード 2. モデルの配置&読み込み 3. モデルの変更&画像生成 ex. ComfyUI Manager を使ったモデルのダウンロード&配置 VAEの変更 1. VAEのダウンロード…
huggingface.co IP-Adapter には顔を生成するように特別にトレーニングされたモデルがあるようです。 この記事では Hugging Face のドキュメント を参考に ip-adapter-full-face_sd15 を使ってみます。
しいたけ を名乗りながら、しいたけ らしいことをあまりしていないと時々書いている。もちろん冗談のつもりである。 よくやるのはJA産直や道の駅に行くたびに しいたけ 写真を撮っていることの他に、ネタっぽい しいたけ 画像を期間限定アイコンやヘッダー画像にお借りして装着することくらいだった。 だがロシアによるウクライナ侵攻と、イスラエルによるガザ侵攻が始まってからは、微力極まりないが一刻も早い停戦を望むという意思表示のつもりでアイコンの色を変更し、それが長期に及んでいる。現在パレスチナ旗カラーを採用しているのは、戦争はどれも悲惨なもので比較すべきではなかろうが私の主観ではガザ侵攻の惨禍がより甚だし…
朝 庭に置いているゴミ袋が、また荒らされていた。人参の皮が目立ったのだろうか。生ごみが入っている袋だけ狙われていた。最近、たびたび荒らされるようになったから、対策を立てないといかんな。 [作業日誌] 07時50分、251。 まーん界隈でGジャンが流行っているみたいで、2名のGジャンが同じシートに座っていた。お互い気まずいだろうな。 土日を挟んで3営業日振りの出社。クリティカルなメールが無くて安堵した。といっても、スマホでちょいちょいメールを確認していたからね。昨日のまとめをトラベラーズノートにかきだした。teamsのチャットにワイ宛ての書き込みがあった。出張中にそんなの見るかよ。 それから、測…
前回、チャレンジして Text-to-Image , Image-to-Image , Inpaint 全てにおいてメモリ不足によるクラッシュが発生しました。 原因としては、サンプルコードが SDXL 系の IP-Adapter となっており、パイプラインを実行する以前に IP-Adapter のロードを突破することができませんでした。 そこで、SDXL 系ではなく SD1.5 系に置き換えて実行してみようと思います。
サッカーに続いて野球少女。 Stable Diffusionは、野球のルールをあまりわかっていないようです(^_^;)
ITに関してめちゃくちゃに初心者。 自力でがんばる記録。 「AI漫画を描けるようになるまで」と書いたものの、現時点ではまだ描けてないので過程のメモです。 まず第一手としてX (旧Twitter) で「生成AI画像」と検索。 生成AI画像クリエイターが「satable diffusion」を使っている情報を得たためグーグル検索し,1番上に来た本家らしきサイトをクリック。しかしTwitterでみたようなプロンプト(生成したい画像を文章化したもの)を入力する枠が見つからず困惑。 「 Japanese Stable Diffusion DX を試す」の項目をクリックしたのにちっとも試す雰囲気じゃないん…
DL初心者です。Kerasについて調べていったことのメモです。 Kerasとは? 特徴は? どんなことができる? 関連ワード ニューラルネットワーク 畳み込みニューラルネットワーク 回帰型ニューラルネットワーク ドロップアウト バッチ正規化 プーリング トークナイザー シーケンシャル Kerasとは? Keras: Deep Learning for humans Kerasはディープラーニング用のライブラリです。 「Pythonで書かれたオープンソースニューラルネットワークライブラリ」となります。 特徴は? Tensor Flowの上位で動きます。 比較的ユーザフレンドリーであり、プロトタイ…
とりあえず、昨日の記事同様、タイトルはすごい長いラノベ風にできたのは良いとして、、、 前回の IP-Adapter の記事に引き続き diffusers v0.24.0 のリリースノート に沿って IP-Adapter を使ってみる回になります。 前回は、 IP-Adapter を差し込んで LCM LoRA を併用していました。 今回は、 ControlNet を併用する形になります。
2024年5月9日に、QYResearchは「拡散接合型マニホールド―グローバル市場シェアとランキング、全体の売上と需要予測、2024~2030」の調査資料を発表しました。本レポートは、拡散接合型マニホールドの世界市場について分析し、主な総販売量、売上、価格、主要企業の市場シェアとランキングに焦点を当てています。また、地域別、国別、製品タイプ別、用途別の分析も行っています。拡散接合型マニホールドの市場規模を2019年から2030年までの販売量と売上高に基づいて推計と予測しています。定量分析と定性分析の両方を提供することで、企業がビジネス成長戦略を策定し、競争環境を評価し、市場位置を分析し、拡散…
IP-Adapter の続きやろーって思ったのですが、日付を見て気づいてしまいました。 あ、、、明日はピッコロ記念日だ。。。 つまり、今日は悟飯の日でしたので、急いで Civitai で検索しました! こちらを採用。やっぱ超サイヤ人2っていいよね!
ver 0.2024.05: 連休の進捗:Pythonと深層学習モデルで動作する画像生成AIの上位Verの挙動の追及を(以下略 連休も終わりって過ごしやすい季節の5月が始まりました。昨年5月のRelease Notesを見返したら、その頃は呪文によって女の子の絵姿を大量召喚する魔術を使っていたようですが、今年は上位バージョンで同じことをしたり旅のイラストを召喚したりであまり変わっていない...! ということで、 id:iwasiman (ver 0.2024.05)が今月もリリースのテストをしているようです。 じぶんRelease Notes / 「ちちぷいトラベル」企画より
また扇情的なタイトルをつけたものね。 堀江貴文のチャットGPTvs未来のない仕事を する人ち読んだ。 ChatGPT vs. 未来のない仕事をする人たち 作者:堀江 貴文 Amazon 私の理解したこの本の概要 AIにおきかえ可能な仕事、例えば弁護士や銀行員どホワイトカラーで高給取りとされている仕事は、未来がない。なぜならAIに置き換え可能だからだ。 新しい技術を恐れるのではなくAIを使い倒してしまえ。 高学歴なんて、受験と言うゲームが上手なだけとがっつり書いてあって、あーほんと私も価値観変えていかないとね。 いまだに息子がゲームばっかりしてたら勉強してくれって思うけど、むしろいいぞやれやれと…
概要 O'Reilly Japan - ゼロから作るDeep Learning ❺ 人気シリーズの第5弾 今回のテーマは「生成モデル」 「正規分布」から「拡散モデル」までの技術を繋がりのあるストーリーとして展開 読者は小さな学びを積み重ねながら、ステップバイステップで実装 最終的には「Stable Diffusion」のような画像生成AIを完成 ソースコードは以下からColab等で実行可能 GitHub - oreilly-japan/deep-learning-from-scratch-5 正誤表 Errata · oreilly-japan/deep-learning-from-scrat…