Open JTalkの合成音声をJuliusで音声認識
MacPortsでインストールしたOpen JTalkの合成音声を、Juliusで音声認識させてみます。マイクのないMacでJuliusをテストするという想定です。
まず、MacPortsでopen_jtalk, julius, ssrcをインストールします。
$ sudo port install open_jtalk julius ssrc
次に、open_jtalk_demoでテキストから合成音声ファイルを作ります。
$ open_jtalk_demo
音声認識技術の性能を試してみましょう
入力した文の音声ファイルは/tmpに作られます。open_jtalk_demoを終了させずに、別のShell上などでssrcを使って、音声ファイルのサンプルレートを16kHzに変換します。
$ ssrc --rate 16000 /tmp/open_jtalk_demo-*.wav sample.wav
変換後の音声ファイルをjuliusに解析させます。
$ julius_demo -input stdin < sample.wav
...Stat: adin_stdin: reading wavedata from stdin...
STAT: 62162 samples (3.89 sec.)
STAT: ### speech analysis (waveform -> MFCC)
pass1_best: 音声認識 技術 の 性能 試し て み ましょう 。
sentence1: 音声認識 技術 の 性能 を 試し て み ましょう 。Error: adin_stdin: stdin reached EOF
reached end of input on stdin
$
この例ではうまく認識してくれました!