さくっと使える。画像の指定部分から文字列を読み取る「Gttext」 // MOONGIFT Archived

GttextはWindows用のオープンソース・ソフトウェアで、画像から指定範囲のテキストをOCR解析します。

画像に書かれた文字列をテキストに直す時に使われるのはOCRですが、ごくシンプルに指定範囲だけをテキスト認識してくれるソフトウェアがGttextです。

インストールはインストーラーが付属するので順番に進めていくだけで完了します。

完了したので早速起動してみます。

画像を読み込んだ所です。BMP/GIF/JPEG/TIFF/PNGといった主立った画像形式に対応しています。

右上にあるテキスト選択ツールを選んで認識したい文字列を選択します。完了するとテキストがダイアログに出ますのでCtrl+Cでコピーされます。

認識させる範囲によりますが認識はこれくらいのレベル。ちなみに認識エンジンは元々HPが開発し、現在はGoogleが引き継いでいるTesseractを使っています。認識言語ライブラリを入れると英語以外の認識もできるようです。

認識結果をXMLに展開します。右側に出ているのはその認識結果のようです。

画像全体からOCR処理を行うこともできます。

設定画面です。

認識精度が十分かと言われるとそんなことはないっぽいですが、画像にはっきりと書かれた文字をさくっと読み取るには十分かも知れません。GttextはWindows用のオープンソース・ソフトウェアで、ライセンスはGPL v2となっています。

MOONGIFTはこう見る

インターネット上にはテキストコンテンツが溢れています。特にTwitterやブログの登場によってテキストコンテンツが爆発的に増えた結果、それらを解析して情報を読み取るニーズがたくさん出てきました。しかし時代はかわり、今は写真コンテンツが急増しています。

原因はスマートフォンの登場によって写真を撮影してアップロードする習慣が一般化しているためです。となればそのアップロードされている写真から情報を読み取れる技術へのニーズが高まっていくことでしょう。食べ物を見つけたり商品を特定できるようなエンジンは特に需要があると思われます。