ESPnet

このタグの解説について

この解説文は、すでに終了したサービス「はてなキーワード」内で有志のユーザーが作成・編集した内容に基づいています。その正確性や網羅性をはてなが保証するものではありません。問題のある記述を発見した場合には、お問い合わせフォームよりご連絡ください。

パソコン関連もろもろ•3ヶ月前

【ESPnet】【WSL2】Python3.11 で ESPnet v.202409 を使う

はじめにESPnetはテキストから音声を合成するモデルです。こちらを見て下さい。 touch-sp.hatenablog.com 今回はタイトルにあるように一番新しいESPnet v.202409を使う方法です。PC環境 Ubuntu 22.04 on WSL2 CUDA 12.4.1Python3.11のインストール sudo add-apt-repository ppa:deadsnakes/ppa sudo apt update sudo apt install python3.11Python環境構築PyTorchのインストール pip install torch==2.4.1 tor…

#ESPnet

ネットで話題

13ブックマーク GitHub - espnet/espnet: End-to-End Speech Processing Toolkit

github.com

関連ブログ

パソコン関連もろもろ•3ヶ月前

【ESPnet】Windows11 で ESPnet を使ってみる

はじめに以前WSL2を使ってESPnetを使ったことがあります。 touch-sp.hatenablog.com 今回はWindows11で使ってみました。PC環境 Windows 11 CUDA 11.8 Python 3.10Python 3.11以降ではうまく環境構築できませんでした。Python環境構築 pip install torch==2.4.1+cu118 torchaudio==2.4.1+cu118 --index-url https://download.pytorch.org/whl/cu118 pip install scipy==1.12.0 pip install…

#ESPnet

パソコン関連もろもろ•2年前

Barkを使って音声合成（日本語も可能）

github.com はじめに以前から「Open JTalk」や「ESPnet」を使って音声合成にチャレンジしてきました。 touch-sp.hatenablog.com touch-sp.hatenablog.com 今回は「Bark」というものにチャレンジしてみました。今までチャレンジしてきた音声合成の中で最も簡単でした。日本語に限って言えば、結果は「ESPnet」の方が良い印象です。環境 Ubuntu 22.04 on WSL2 CUDA 11.8 Python 3.10pip install torch==2.0.1+cu118 torchvision==0.15.2+cu118 …

#ESPnet#Open JTalk

パソコン関連もろもろ•3年前

【続】【ESPnet】テキストファイルからいろいろな音声ファイルを作成する

はじめに前回ESPnetというのを使わせて頂き音声合成を行いました。 touch-sp.hatenablog.com スクリプトを一部変えるだけで様々な音声が合成できるようなので今回一部を試してみました。結果（3種類の音声）jsut前回と同じです。 text2speech = Text2Speech.from_pretrained( model_tag=str_or_none('kan-bayashi/jsut_full_band_vits_prosody'), vocoder_tag=str_or_none('none'), device="cuda" ) tsukuyomi text2sp…

#ESPnet#音声合成#WSL2

パソコン関連もろもろ•3年前

【ESPnet】【PyTorch】【WSL2】ESPnetを使ってテキストファイルから音声ファイルを作成する

最終更新日：2023年4月14日はじめに PC環境 Python環境構築 Pythonスクリプト用意するテキストファイル使い方インストールされたライブラリのバージョンその他の環境 2022年7月9日追記①（torch==1.12.0+cu113） 2022年7月9日追記②（torch==1.12.0+cu116） 2023年2月11日追記（torch==1.13.1+cu116） 2023年4月14日追記（torch==1.13.1+cu117） 2022年7月12日追記はじめに以前「Open JTalk」を使って同様のことをしました。 touch-sp.hatenablog.co…

#ESPnet#WSL2#音声合成

nikkie-ftnextの日記•3年前

声をPythonに聴かせて（後編：対処し、マイクの音声でも「変じゃないよ」）

はじめに私の熱い『アイの歌声を聴かせて』ファン活動、アイカツ、はじまります！私のアイカツ（#アイの歌声を聴かせて技術者なりのファン活動）、シオン v0.0.1に大きく近づきました🙌この嬉しさ、「やったな、サンダー」級！！プログラムを起動してから音声で入力、すると音声でオウム返ししてくれます！😆（デモでお見せしたいのですが、どう収録すればいいのかな？） pic.twitter.com/vew5qjSLv8— nikkie にっきー / アイうた円盤📀発売アドカレ中 (@ftnext) 2022年2月13日この記事は、アイの歌声を聴かせてに関する一技術者なりのファン活動の一幕です。 "ポン…

#アイの歌声を聴かせて#作ろうシオン#音声認識#ESPnet

nikkie-ftnextの日記•3年前

声をPythonに聴かせて（前編：wavファイルだと書き起こせるのに、マイクの入力はいまいち！？）

はじめに私の熱い『アイの歌声を聴かせて』ファン活動、アイカツ、はじまります！私のアイカツ（#アイの歌声を聴かせて技術者なりのファン活動）、シオン v0.0.1に大きく近づきました🙌この嬉しさ、「やったな、サンダー」級！！プログラムを起動してから音声で入力、すると音声でオウム返ししてくれます！😆（デモでお見せしたいのですが、どう収録すればいいのかな？） pic.twitter.com/vew5qjSLv8— nikkie にっきーシオンv0.0.1開発中⚒ (@ftnext) 2022年2月13日この記事は、アイの歌声を聴かせてに関する一技術者なりのファン活動の一幕です。実は私、大好…

#アイの歌声を聴かせて#作ろうシオン#音声認識#ESPnet