Capture2Textは画面上の任意の部分をOCR処理できるソフトウェアです。

オンラインにあるのはテキストだけとは限りません。テキストを埋め込んだ画像コンテンツもたくさんあります。そこから効率的にテキスト情報を素早く抽出できるソフトウェアがCapture2Textです。


コンテストメニューに常駐します。


利用はショートカットキーで行います。


OCRエンジンの選択画面です。

[![](http://images.moongift.jp/2013/03/Screenshot 2013-03-25 11.38.04_thumb.1364263546.png)](http://images.moongift.jp/2013/03/Screenshot 2013-03-25 11.38.04.1364263546.png)
利用時。マウスで選択した文字(青くハイライトされています)部分が画面上に解析されて文字として出ています。

Capture2Textは60近くの言語に対応してOCR処理が行えます(エンジンにTesseractを利用)。そしてさらに解析結果をGoogleのテキスト to スピークAPIに渡すことで音声による読み上げにも対応します。テキストはクリップボードに保存される仕組みです。

Capture2TextはWindows用のオープンソース・ソフトウェア(GPL v3)です。

MOONGIFTはこう見る

OCRから音声読み上げまでつなげてしまうとまた別な付加価値が生まれそうという面白い例かも知れません。さらに翻訳と組み合わせることで、その言語を知らない人にとっても意味が通じるテキストができるようになります。

デジタルの世界は急速に範囲を広げていますが、それでもまだまだリアルな世界にあるコンテンツの方が圧倒的に多いでしょう。そこからいかにデジタル化できる情報を吸い上げられるかが肝になるのではないでしょうか。

Capture2Text

Capture2Text | Free software downloads at SourceForge.net