Open JTalkの合成音声をJuliusで音声認識

MacPortsでインストールしたOpen JTalkの合成音声を、Juliusで音声認識させてみます。マイクのないMacでJuliusをテストするという想定です。

まず、MacPortsでopen_jtalk, julius, ssrcをインストールします。

$ sudo port install open_jtalk julius ssrc

次に、open_jtalk_demoでテキストから合成音声ファイルを作ります。

$ open_jtalk_demo
音声認識技術の性能を試してみましょう

入力した文の音声ファイルは/tmpに作られます。open_jtalk_demoを終了させずに、別のShell上などでssrcを使って、音声ファイルのサンプルレートを16kHzに変換します。

$ ssrc --rate 16000 /tmp/open_jtalk_demo-*.wav sample.wav

変換後の音声ファイルをjuliusに解析させます。

$ julius_demo -input stdin < sample.wav
...
Stat: adin_stdin: reading wavedata from stdin...
STAT: 62162 samples (3.89 sec.)
STAT: ### speech analysis (waveform -> MFCC)
pass1_best: 音声認識技術の性能試してみましょう。
sentence1: 音声認識技術の性能を試してみましょう。
Error: adin_stdin: stdin reached EOF
reached end of input on stdin
$

この例ではうまく認識してくれました！