技術 - OCRの記事一覧
gDriveOCR - Google Driveを使ったOCR
OCRは大抵スキャナなどに備わっています。オープンソースのOCRもあることはあるのですが、品質はあまり高くありません。画像の中から効率的に情報を取り出す方法は手間がかかるイメージがあります。紙文書からテキストデータを取り出すのに苦労した人も多いでしょう。今回紹介するgDriveOCRはスマートな解決手法になるそうです。...
Tesseract.js - なんと!Webブラウザでも動作するJavaScript OCRエンジン
今後OCRのニーズは高まっていきます。世界中で写真が撮影されており、そこから意味を見いだす上でテキスト情報は欠かせません。ディープラーニングも使われていますが、テキストとして得られる情報はまだまだ多いでしょう。そんなOCRをJavaScriptで実行してしまうのがTesseract.jsです。なんとWebブラウザベース...
Screenotate - スクリーンショットから自動で文字起こし
当たり前ですが、スクリーンショットは画像で保存されます。Webサイトを画像として残したい時にはそれで十分ですが、ニュースや記事などテキスト情報が欲しいと思うこともあるでしょう。そんな時にテキストだけ別で保存するのは面倒くさいです。そこで使ってみたいのがScreenotateです。撮影したスクリーンショットをORC解析し...
JavaScript OCR demo - クライアントサイドだけで実現するOCR
JavaScriptでOCR!HTML5にはカメラにアクセするAPIが用意されています。それによってWebカメラを使った動画チャットが幾つか作られています。しかしその使い方しかないのでしょうか。もっと面白い使い方が考えられるはずです。Webカメラの映像を動画として捉えるのではなく、撮影した画像として考えるともっと利用で...
Ocrad.js – JavaScriptでOCR!
JavaScriptでどこまでできるのか、そんな挑戦が去年くらいからはじまっています。その鍵を握っている技術がEmscriptenです。C/C++が生成するLLVMビットコードからJavaScriptを出力できるソフトウェアです。既に様々なソフトウェアがJavaScriptで動作するようになっていますが、今回はOcra...
スクリーン上の任意の場所をキャプチャしてOCR/音声読み上げ「Capture2Text」
Capture2Textは画面上の任意の部分をOCR処理できるソフトウェアです。オンラインにあるのはテキストだけとは限りません。テキストを埋め込んだ画像コンテンツもたくさんあります。そこから効率的にテキスト情報を素早く抽出できるソフトウェアがCapture2Textです。コンテストメニューに常駐します。利用はショートカ...
業務で使えるオープンソース(68)「OCR」
今回のテーマはOCRです。リアルの世界に溢れているテキスト情報を読み取り、デジタル化することでテキスト情報の量は爆発的に膨らみます。今回はそのOCRの利用法や関連オープンソース・ソフトウェアをまとめて紹介します。
震災対応支援。FAXから情報を効率的に収集、活用「Shinsai FaxOCR」
Shinsai FaxOCRはFAXを自動OCRし、そこから得られた数字を一覧、集計できる管理システムです。2011年3月の地震は痛ましい災害でしたが、ただ嘆くだけでなくその時期だからこそ生まれた素晴らしいプロダクトがたくさんあります。今回はその一つ、Shinsai FaxOCRを紹介します。ログインします。ダッシュボ...
さくっと使える。画像の指定部分から文字列を読み取る「Gttext」
GttextはWindows用のオープンソース・ソフトウェアで、画像から指定範囲のテキストをOCR解析します。画像に書かれた文字列をテキストに直す時に使われるのはOCRですが、ごくシンプルに指定範囲だけをテキスト認識してくれるソフトウェアがGttextです。インストールはインストーラーが付属するので順番に進めていくだけ...
Tesseract OCRをGUIから手軽に利用。画像やPDFをOCR処理する「gImageReader」
gImageReaderはTesseract OCRのWindows/Linux用GUIフロントエンド。PDFや画像をOCR処理する。gImageReaderはWindows/Linux用のオープンソース・ソフトウェア。リアルとデジタルを繋ぐ技術は常に人気が高い。地図、写真、位置情報、交通機関の情報などリアルに関係する...
Javaベースの英文OCR「Eye」
EyeはJava製のフリーウェア(ソースコードは公開されている)。電子書籍に注目が集まっている。今後出てくる書籍については電子書籍と一般書籍を同時に出版するところも増えてくるだろう。しかしそれ以上の多いのが既存の資産だ。ただデジタル化するだけでなく、テキストなどに変換しなければならない。上が画像、下が認識されたテキスト...
待ちに待ったオープンソースの日本語OCR「NHocr」
OCRという技術はアナログなデータをデジタル化する上で欠かすことができない。しかし様々な特許が絡み、オープンソースやフリーウェアとしては発展しづらい分野でもある。しかしそこに風穴を開けられるかも知れない技術が登場しそうだ。デモサービスで試せます 今回紹介するオープンソース・ソフトウェアはNHocr、日本語OCRシステム...
無料でPDFのOCR「クセロReader ZERO」
うーん、これは凄い。OCRという技術はフリーでは殆ど見られない(日本語では昔あったが、今はない)位、高い専門性と特許が絡んだ難しい技術だ。それを無料で利用できるというのが素晴らしい。オフィスでも多用されるPDFについて、OCRを適用したければこれを使おう。今回紹介するフリーウェアはクセロReader ZERO、OCR機...
オープンソースOCR「GNU Ocrad」
昨日に引き続きOCRソフトウェアのご紹介。このOCRと言う分野は今後のデジタル化推進の上で重要な技術になり得るのだが、どうもオープンソースではあまり流行っていない。 そんな中、数少なくも存在するOCRエンジンがこれだ。 今回紹介するオープンソース・ソフトウェアはGNU Ocrad、CUIベースのOCRエンジンだ。 ...
TesseractをWindowsで「Tesseract Windows GUI」
先ほどのTesseract OCRの記事ではスクリーンショットを掲載していない。実際に試すには試したのだが、公式サイトで配布されているものを使った訳ではないからだ。なにぶん、Linuxなどでコンパイルしながらインストールするのはちょっと面倒だ。 OCRエンジンの性能を試すなら、これが一番手軽だろう。何せWindows...
Googleが手がけるOCR「Tesseract OCR」
新しいサービス(といっても大層なものではない)を作ろうと思った時に、画像の中の文字列を読み取る仕組みが必要な事に気づいた。いわゆるOCRだ。 オープンソースのOCRはごく僅かだが存在する。今回はその中の有力なものを紹介しよう。 今回紹介するオープンソース・ソフトウェアはTesseract OCR、Googleが手がける...
Web上でOCR「WeOCR Project」
会議室にあるホワイトボード。印刷する仕組みがあれば良いが、そうでない場合は携帯電話のカメラで撮影していく事がある。後で見返すと会議の内容が思い出せるのは便利だが、画像データのままと言うのがいただけない。テキストデータに落とし込む仕組みはないだろうか。スキャナなどがあれば、OCRと言う手がある。これは大抵スキャナ付属、...