OCRは大抵スキャナなどに備わっています。オープンソースのOCRもあることはあるのですが、品質はあまり高くありません。画像の中から効率的に情報を取り出す方法は手間がかかるイメージがあります。紙文書からテキストデータを取り出すのに苦労した人も多いでしょう。 今回紹介するgDriveOCRはスマートな解決手法になるそうです。OCRとしてGoogle Driveを使います。

gDriveOCRの使い方

たとえば次のようなコマンドを打ちます。日本語も指定可能です。

gdriveocr moongift.png

実行後、Wordファイルがダウンロードされます。元の画像と、そのOCR結果が表示されます。

gDriveOCRはGoogle DriveのOCR機能を使って、コマンドでファイルをアップロードした後、結果のテキストを埋め込んだWordファイルをダウンロードします。コマンドなので大量のファイルがあっても自動化できるでしょう。面白いGoogle Driveの使い方です。

gDriveOCRはnode/JavaScript製のオープンソース・ソフトウェア(MIT License)です。

ttv20/gDriveOCR: OCR by Google Drive API