Diffution

このタグの解説について

この解説文は、すでに終了したサービス「はてなキーワード」内で有志のユーザーが作成・編集した内容に基づいています。その正確性や網羅性をはてなが保証するものではありません。問題のある記述を発見した場合には、お問い合わせフォームよりご連絡ください。

人工知性を作りたい•3年前

テキストから音声の生成モデル「DiffSound」を動かす【#Text-to-Sound】【#音声AI】

今期はテキストから音声を生成するモデル"DiffSound"をpretraindeモデルで動作させる方法を記載します。入力テキストには「Birds and insects make noise during the daytime」のような文章を使用し、その文章に適した音声が生成されるというモデルになります。このモデルはテキストから音声への生成結果が良いだけでなく、生成速度も早く、従来のARデコーダの５倍の生成速度であることが論文内で示されています。 DiffSound作成者が公開しているデモページがあるのでご確認ください。 Diffsound: Discrete Diffusion Mod…

#AI#DiffSound#textToSound#Diffution

関連ブログ

テキストから音声の生成モデル「DiffSound」を動かす【#Text-to-Sound】【#音声AI】

関連ブログ