無料でPDFのOCR「クセロReader ZERO」
うーん、これは凄い。
OCRという技術はフリーでは殆ど見られない(日本語では昔あったが、今はない)位、高い専門性と特許が絡んだ難しい技術だ。
それを無料で利用できるというのが素晴らしい。オフィスでも多用されるPDFについて、OCRを適用したければこれを使おう。
今回紹介するフリーウェアはクセロReader ZERO、OCR機能がついたPDFビューワだ。
クセロReader ZEROはタブがついたPDFビューワーで、複数のPDFを閲覧するのに便利なソフトウェアだ。しおりやサムネイルを表示するといった機能もある。
そして最も便利な機能として取りざたされるのがOCR機能だ。試してみた所では多少の誤字認識はあったものの、十分実用レベルだ(PDF中の文字列を検索するという目的には十分)。
さらに画像をクセロReader ZEROにドラッグアンドドロップするだけでPDF化する機能もある。その上でOCR変換すれば、単なる画像から文字列を取り出して検索可能にしてしまうのだ。
ドキュメントスキャナーを使って、各種書籍をPDF化しているのだが、その中にはOCRし忘れてしまったものもあった。250ページを越える書籍でも、時間はかかったがきちんとOCR処理され、PDF内に日本語文書が埋め込まれた。これで検索もでき、非常に便利になる。
プリンタドライバとしてPDFを作成するソフトウェアの中には、日本語埋め込みができないものもある。そうした際に補助として使うのにも便利なソフトウェアだ。
クセロ** Reader ZERO**
http://xelo.jp/xelopdf/readerzero/index.html