gDriveOCR - Google Driveを使ったOCR
OCRは大抵スキャナなどに備わっています。オープンソースのOCRもあることはあるのですが、品質はあまり高くありません。画像の中から効率的に情報を取り出す方法は手間がかかるイメージがあります。紙文書からテキストデータを取り出すのに苦労した人も多いでしょう。 今回紹介するgDriveOCRはスマートな解決手法になるそうです。OCRとしてGoogle Driveを使います。
gDriveOCRの使い方
たとえば次のようなコマンドを打ちます。日本語も指定可能です。
gdriveocr moongift.png
実行後、Wordファイルがダウンロードされます。元の画像と、そのOCR結果が表示されます。
gDriveOCRはGoogle DriveのOCR機能を使って、コマンドでファイルをアップロードした後、結果のテキストを埋め込んだWordファイルをダウンロードします。コマンドなので大量のファイルがあっても自動化できるでしょう。面白いGoogle Driveの使い方です。
gDriveOCRはnode/JavaScript製のオープンソース・ソフトウェア(MIT License)です。