github.com はじめに以前から「Open JTalk」や「ESPnet」を使って音声合成にチャレンジしてきました。 touch-sp.hatenablog.com touch-sp.hatenablog.com 今回は「Bark」というものにチャレンジしてみました。 今までチャレンジしてきた音声合成の中で最も簡単でした。 日本語に限って言えば、結果は「ESPnet」の方が良い印象です。環境 Ubuntu 22.04 on WSL2 CUDA 11.8 Python 3.10pip install torch==2.0.1+cu118 torchvision==0.15.2+cu118 …