JamesはMac OSXの音声認識をRubyから操作できるライブラリ。

JamesはRuby製/Mac OSX用のオープンソース・ソフトウェア。近未来の世界において(映画の中で)たびたび登場するのが音声認識によるコンピュータの操作だ。テレビをつけたり照明を消したり、必要な情報を音声によってやり取りする。


実行中

今のコンピュータでも実際には音声認識は可能だ。だがあまり使われていないイメージがある。そこでもっと使いやすくしてくれるのがJamesだ。

Jamesはコンピュータの中の人の名前だ。そしてMac OSXに標準で搭載されている音声認識機能を使って指令を受け取り、それをRuby上で実行してメッセージを返却する。処理を実行して終わることも、逆に音声を読み上げて完了を知らせることもできる。


コマンド例

時刻を言う、Twitterを取得する、iTunesを立ち上げた後に再生操作を行うなど様々なデモが用意されている。普段Rubyを使って行っていたスクリプトを音声処理に切り替えるようなイメージだ。なお認識精度はあまり高くない(または筆者の英語が悪いとも言う)ので、あまり長い文章での指令は控えた方が良いだろう。

MOONGIFTはこう見る

Jamesは終了時に音声で伝えたり、実行したコマンドに対して音声で返答したりと対話型にすることができる。音声認識は今のところ英語しか使えないが、聞き取る文章をローマ字で記述すればある程度日本語に似せた文章でも読み取れるはずだ。

iPhoneにも音声認識はあるがとても使えるレベルではないと思われる(とにかく勝手に電話をかけたがる)。とは言え音声認識にはアクセシビリティ向上以上の可能性があると思われるので、それを使った面白い活用法がもっと出てくるはずだ。

floere/james - GitHub