Julius

新しい入力インタフェース

Julius ロゴ

昔、Macintoshのソフトウェアの一つに音声認識のソフトウェアがあった。例えば、「What time is it now?」と言えば、現在時刻を告げてくれるような感じだ。未来を予感させる凄い技術だと感動した覚えがある。

しかし現実はそれ程甘くなく、英語の発音が多少でも悪いと全く動作しなかった。Performaに付属の小さなマイクに向かって何度も何度も「What time is it now?」を連呼し、周囲から怪しい目で見られたと言う嫌な思い出が残っている。

本日紹介するオープンソース・ソフトウェアはJulius、日本製の音声認識ソフトウェアだ。数万語の語彙を対象とした文章を認識できる。

最大の特徴は可搬性にあるとの事だ。つまり辞書や言語モデルの指定を変える事で、様々な用途に利用できる。テープ起こし等も出来てしまうのだろうか。

音声認識は幅広いニーズが存在する。その中にあって、Unix系、Windows系と双方に対応しているのは魅力的だ。ミーティングやインタビューを録音する事は多々あるが、それを入力しなおすのは結構な手間だ。これが解決の糸口になるかも知れない。

肉体的な障害に対しても対応できるだろうし、キーボードでの入力が面倒な人についても利用が考えられる。使い道は十分過ぎるほどあり得るだろう。