ITエンジニア/デザイナ向けにオープンソースを毎日紹介

うーん、これは凄い。

3Dsearch1 Thumbnail-27

OCRという技術はフリーでは殆ど見られない(日本語では昔あったが、今はない)位、高い専門性と特許が絡んだ難しい技術だ。

それを無料で利用できるというのが素晴らしい。オフィスでも多用されるPDFについて、OCRを適用したければこれを使おう。

今回紹介するフリーウェアはクセロReader ZERO、OCR機能がついたPDFビューワだ。

クセロReader ZEROはタブがついたPDFビューワーで、複数のPDFを閲覧するのに便利なソフトウェアだ。しおりやサムネイルを表示するといった機能もある。

3Dsearch2 Thumbnail-22

そして最も便利な機能として取りざたされるのがOCR機能だ。試してみた所では多少の誤字認識はあったものの、十分実用レベルだ(PDF中の文字列を検索するという目的には十分)。

さらに画像をクセロReader ZEROにドラッグアンドドロップするだけでPDF化する機能もある。その上でOCR変換すれば、単なる画像から文字列を取り出して検索可能にしてしまうのだ。

3Dsearch3 Thumbnail-21

ドキュメントスキャナーを使って、各種書籍をPDF化しているのだが、その中にはOCRし忘れてしまったものもあった。250ページを越える書籍でも、時間はかかったがきちんとOCR処理され、PDF内に日本語文書が埋め込まれた。これで検索もでき、非常に便利になる。

3Dsearch4 Thumbnail-16

プリンタドライバとしてPDFを作成するソフトウェアの中には、日本語埋め込みができないものもある。そうした際に補助として使うのにも便利なソフトウェアだ。

クセロReader ZERO

 http://xelo.jp/xelopdf/readerzero/index.html

 

MOONGIFTの関連記事

コメント

  • DevRel
  • Com2