昨日に引き続きOCRソフトウェアのご紹介。このOCRと言う分野は今後のデジタル化推進の上で重要な技術になり得るのだが、どうもオープンソースではあまり流行っていない。

そんな中、数少なくも存在するOCRエンジンがこれだ。

今回紹介するオープンソース・ソフトウェアはGNU Ocrad、CUIベースのOCRエンジンだ。

GNU Ocradは画像を使って文字抽出が可能だが、その形式はPBM、PGM、PPM、PNMに限定される。通常の画像(PNGなど)であれば、ImageMagick等を使って変換する必要がある。

実際に認識させてみた限りでは結果は良好だ。手書き等ではあまり良くないだろうが、コンピュータ出力の文字列を認識させたり、新聞や雑誌などの文字であればまずまずなのではないかと思う。

もちろん、日本語の解析はできないので、運用される場面は限られてしまうだろう。だが、英文の文書や写真などの解析では利用できる。尚、KDE標準のスキャナーソフトウェア、Kookaでのエンジンとして利用できる。

更なるデジタル化を図る上で外して考えることのできないOCR技術。ぜひ日本語下でも同様の動きが高まって欲しいと思う。

 

Ocrad - GNU Project - Free Software Foundation (FSF)
 http://www.gnu.org/software/ocrad/ocrad.html