TwitterやFacebook、ブログなどオンラインにはテキストコンテンツが溢れています。メールも配信数が増すばかりで膨大な情報量を処理するのが困難になってきているのではないでしょうか。 そこで必要になるのがテキストから本当に必要な部分だけを抽出する技術ではないかと思います。そうすることで余計な情報を省き、処理量を減らせるようになります。 英語向けですが、そんなJavaScriptライブラリであるKnwl.jsを紹介します。 実行例。左側のテキストに対して右側に抽出された情報が一覧になっています。 任意のテキストから電話番号、日付、時間、場所、リンク、メールアドレスをはじめ様々な情報が抽出されます。また、スパム判定機能も備わっています。Knwl.jsをベースにすることでカレンダーに自動登録する機能を開発したり、アドレス帳登録の情報を補完する機能などが考えられるようになりそうです。 だらだらと長い割に大した意味のないメールなど読んだら相当なストレスになるのではないでしょうか。Knwl.jsを使って意味のあるメールから処理するようにすれば、ずっと効率的に作業ができるようになるでしょう。 使い方は簡単で、テキストを当てはめるだけです。

var x = new Knwl();
x.init( string );

後は抽出したい情報を指定します。

// 日付の場合
x.get('dates');

Knwl.jsはJavaScript製、MIT Licenseのオープンソース・ソフトウェアです。 Knwl.js demo loadfive/Knwl.js