gImageReaderはWindows/Linux用のオープンソース・ソフトウェア。リアルとデジタルを繋ぐ技術は常に人気が高い。地図、写真、位置情報、交通機関の情報などリアルに関係するものはみんなが必要としている。疎sの一つ、リアルの情報を取り込む技術として知られるのがOCRだ。 0
![]()
PDFや画像を開く
0
名刺の読み取りを行うソフトウェアは何年経っても人気がある。スマートフォンが登場してさらに人気が高まっている。オープンソースのOCRであるTesseract OCRをGUIで扱うのがgImageReaderだ。 0
gImageReaderはPDFや画像ファイルを読み込んで、指定された言語に基準としてOCR処理を行うTesseract OCRフロントエンドだ。Tesseract OCRはGoogleが開発を手がけており、期待ができるのだが辞書や設定次第で精度がかわってくるようだ。 0
![]()
認識結果。悲惨だ…
0
日本語の認識も可能だが、PDFが日本語の表示に対応していないようだ。そのため画像の方が良いかもしれない。またTesseract OCRの辞書ファイルを使わないと精度はまるで低いようだ。使い方はとても簡単で、画像やPDFを開いて認識ボタンを押すだけだ。そうすれば右側に認識された文字列が表示される。 0
どこを文字として認識しているかが分からないので、絵やグラフが入ったものは認識精度が高くなさそうだ。テキスト文書などで試すと良い結果が得られるかもしれない。 0
プレミアムユーザには“MOONGIFTはこう見る”、記事の一行概要、追加スクリーンショット、デモや追加URLが表示されます。登録(500円/月)はこちらから! プレミアムユーザのログインはこちらから 0
gImageReader | Download gImageReader software for free at SourceForge.net












アンケート