Hatena::ブログ(Diary)

JJsの日記 このページをアンテナに追加 RSSフィード

2012年12月07日

Windows8の音声認識機能を使ってみた

導入のきっかけ

文章入力をもう少し早くできないかなと考えていたところ、

ふと音声認識ソフトというものがあることを思い出した。


VocaloidとかSoftTalkのように文章を歌ったり、読み上げるソフトは有名だが、

逆に人間が話す言葉を理解して、パソコンを操作したり、文章を書きあげるソフトは

まだまだ認知度も人気も低い。


最初から純正ソフトとして入っているので、検索窓に「音声認識」と入れるだけで、

すぐに起動して使えるようになる。

f:id:JJs:20121208002628p:image

ということでさっそく使ってみた。


どんなソフト?

マイクが一本あればすぐに使えるようになる、Windwos純正の音声認識ソフトウェア。

最初に自分の声や喋り方を覚えさせるため、30分〜2時間ほどの音声認識チュートリアルと

音声認識の向上を行う必要がある。


使ってみて

元々あまり滑舌がいいほうではないので、残念ながら文章を書くのには全くと言っていいほど使えなかった。


ただ、Windwosの操作や各種アプリーケーションソフトの操作では、かなり有用なことが分かった。

ずっと音声認識ソフトウェアを使うわけではなくて、スポット的に、パソコン操作の補助手段として

使うのが非常によかった。


あまり使わないが「マウスグリッド」 or 「マウスオーバー」と言うと、マウスでクリックしたい

場所を指定できる。

f:id:JJs:20121208001124p:image


区切られた区画で、クリックしたい個所の番号を言えば、どんどん格子状に区切られた区画が

小さくなっていく。ここまで小さくすれば、Youtubeでの表示をするためのボタンをクリックできる。

f:id:JJs:20121208001123p:image

ここで、「いち」or「にい」or「よん(し)」or「ご」と言った後に「クリック」と言えば、別タブでYoutubeの再生が始まる。


Internet Explorerの画面上で、「番号を表示」と言えば、クリックできる個所が

番号で表示される。

f:id:JJs:20121208001122p:image

クリックしたい個所の番号を言えば、その場所がクリックされ、画面を切り替えて、

その内容を見ることができる。


メモ帳はもちろん、PhotoshopやLightroom4も起動させることができるし、終了させることもできる。

「メモ帳を開く」と言えばメモ帳が開くし、「それを閉じる」と言えば、現在選択されている

アプリケーションソフトを終了できる。最小化したい場合は「それを最小化」と言う。

マウスオーバーほど派手さのない機能だが、実際はこちらのほうが有用。

恐ろしいことに、IMEで「単語の登録」をしているため、dispcalGUIもちゃんと起動することができた。


音声認識が上手くいかないので

開く、閉じる、キャンセル、最大化などの単語はよく拾ってくれるので、Windwos操作の補助には

問題があまりないが、文章は全く書けない。

さすがにバッファローのマイクだと、安すぎてきちんと声を拾ってくれないのだろうか。


探してみたら、ソニーのマイクがコスパがよくて、性能もかなりいいようだ。

これのうち、どちらかを買ってみようかな。

ぽんぺいぽんぺい 2016/01/22 13:10 とおりすがりのもので失礼します。
今日で二日目の使用です。
私の場合ノートパソコンの内臓マイクを40センチほど離して使用しています。
トレーニングをせずに録画したテレビの番組を、ヘッドホンで再生し内臓マイクに近づけて認識したところ、
遅れながらも変換しました。
その後、トレーニングをして新聞記事をメモ帳に入力したところ、以前よりも認識率がよかったです。
まず第一にマイクの性能
第二に正しい発音とスピードだそうです。
私の場合これだったらイケルと思いました。

JJsJJs 2016/01/25 21:24 ぽんぺいさん、コメントありがとうございます。テレビ番組もそのまま入力できたのは面白いですね。
マイクはソニーのものを買いましたが、確かに認識率がよくなりました。
地味に役に立つコマンドもあるので、どんどん活用したいですね!

スパム対策のためのダミーです。もし見えても何も入力しないでください
ゲスト


画像認証