テキスト解析を使ったシステム連携に。Webベースの形態素解析エンジン「Igo GAE」
Igo GAEはGoogle App Engine/Javaを使って形態素解析エンジンのIgoを動作させる。
[/s2If]
Igo GAEはJava製/Google App Engine用のフリーウェア(ソースコードは公開されている)。日本語を解析するのに使われているのがいわゆる「形態素解析」だ。名詞や形容詞などに分割することによって、システムとの連携をしたり文書の意味を解析できるようになる。
メイン画面
方法は幾つか存在する。ローカルで行うならMeCabやKAKASI、ChaSenが有名だ。そしてWebサービスとして提供されているのがYahoo! Japanの日本語形態素解析Webサービスになる。Yahoo!同様、Webベースで独自のシステムを使いたいならばIgo GAEを使ってみよう。
Igo GAEはJava製の形態素解析エンジンであるIgoをGoogle App Engine上に移植したソフトウェアだ。Igoの辞書フォーマットはほぼMeCab互換となっている。Webブラウザ上での入力はもちろん、GETやPOSTを使って外部システムから利用することもできる。
解析結果
形態素解析はもちろん、分かち書きにも対応している。さらにJavaScriptライブラリも提供されており、Web APIのように形態素解析を利用できるようになっている。文字コードはUTF-8のみならずEUC-JPやShift-JISでも使えるとのこと。形態素解析エンジンを疎結合で使える、便利なソフトウェアだ。
分かち書きも(プレミアム限定)
[/s2If] [s2If !current_user_can(access_s2member_level1)]
MOONGIFTは読者の皆さまのサポートによって運営されています。ぜひプレミアム登録お願いします!月 額500円の他、半年(3,000円)、年間パック(6,000円)もあります。! プレミアムユーザのログインはこちらから
[/s2If]
MOONGIFTはこう見る
自前の形態素解析エンジンを構えようと思うと、MeCabのようなローカル版を使うのが一般的だった。だがIgo GAEを使えばGoogle App Engineのパワーを使いつつ利用できれば、外部システムとの連携も容易だ。解析結果は単純な文字列として得られるので加工は簡単だ。
Google App Engineをライブラリの一部として使ってしまうというアイディアはなかなか面白い。テキスト解析はもちろん、画像加工やデータ収集といった場合にも応用できそうだ。
Igo: GoogleAppEngineで形態素解析サーバ - sileの日記
[/s2If]