Speech APIはJavaScriptとFlashを使ったWebベースの音声認識/出力ソフトウェア。

Speech APIはJavaScript/Flash製のオープンソース・ソフトウェア。コンピュータが一般化される前から技術的には存在したが、今ひとつ流行らなかったのが音声入力だ。AppleのMacintoshの前で英語を発音していた頃が懐かしい。


音声認識デモ

少し現実味が出てきたのはスマートフォントの組み合わせだ。あの小さなデバイスでの入力は面倒で、音声を介して操作できるのは便利な場面もある。そしてローカルアプリケーションでは難しくとも、Web上であれば別な利用法もあるかも知れない。その可能性を感じさせるのがSpeech APIだ。

Speech APIはサーバにRed5、クライアントにはJavaScriptとFlashを使ったWebベースの音声認識システムだ。通信にはRTMPを使っている。デモではボタンを押して発音をし、それを認識させるものなどが登録されている。認識される音声は自分で設定できるようになっている。


しゃべりはぼそぼそ

音声を認識するだけでなく、逆に話すこともできる。またJavaScriptと連動することでフォームの値を変えたり、フォーカスを移動すると言ったこともできる。認識パターンは自分で設定ができるが、これがあまり多いとサーバの負荷につながるのだろう。具体的な使い方は記されていないが、面白い試みのソフトウェアだ。

MOONGIFTはこう見る

音声認識は日本では使えるレベルのものはほぼ皆無ではないだろうか。さらにマイクを標準装備したデスクトップは少なく、利用者もあまり多くないのが実情だ。だがキーボードという入力方式が正解なのかと言われると疑問符がつく。

またコンピュータが生まれて数十年だ。入力デバイスについてはまだまだ進化する余地があるだろう。音声による入出力はその一つと言える。もっと自由にコンピュータと対話できるようになれば、使い道が大きく開けるのではないだろうか。

SpeechAPI Home

デモ:Speech API Demos

speechapi - Online Javascript and Flash speech recognition API - Google Project Hosting