音声入力というのはずっと昔からあるわりには一般的な普及が進まない技術だ。もちろん、何らかの障害がある方々の間では利用されているが、もっと一般に普及しなければよりよい技術革新やコスト低減などが臨めないのではないだろうか。

Picture 239.png

単語の認識精度は高い

 

そんな中、一つのきっかけになり得るソフトウェアが登場した。なんとJavaScriptを埋め込むだけで音声入力が可能になる。

今回紹介するオープンソース・ソフトウェアはw3voiceIM.js、Web APIを使った音声認識ライブラリだ。

w3voiceIM.jsはw3voice.jpで提供される音声認識エンジンをJavaScriptだけで利用できるようにするライブラリだ。テキストボックスやテキストエリアに対して利用可能で、オブジェクトをダブルクリックすると音声入力のダイアログが表示される。

Picture 241.png

Pukiwikiに組み込まれた例。テキストエリアに音声入力できる

 

エンジンはJavaを使って開発されている。ウィンドウに表示されるボタンを押すと認識が開始されるので、マイクに向かって何か言えば良い。日本語向けのエンジンなので、日本語を問題なく扱える。

認識の精度はそこそこ高い。ただし登録されていない単語については失敗する可能性が高いので、その場合は認識辞書を更新することで対応ができるとのこと。フォームへの入力サンプルや、Pukiwikiに組み込んだデモを使ってw3voiceIM.jsの魅力を試せるようになっている。

音声のスピードは通常の会話程度でもきちんと認識する。むしろ明瞭に話すことの方が認識率を高めるのに重要なようだ。長文の入力には向かないが、駅名の入力や遊園地などの場所の音声入力などで役立ちそうだ。

 

音声認識テキスト入力Javascriptライブラリ w3voiceIM.js

 http://w3voice.jp/engine/