Google App Engineを使ったMapReduce「Appengine Mapreduce」
Appengine MapreduceはGoogle App Engine用Python製のオープンソース・ソフトウェア。Googleの基礎技術の一つであるMapReduce。膨大な文字列やデータを細かく細分化し、無数のコンピュータ上で並列処理させることで高速なシステムを実現する仕組みだ。
実行画面
MapReduceはAmazon Webサービスにも真似されており(Amazon Elastic MapReduce)、有益さが分かっている。だが、どう使えば良いかが今ひとつ実感できないかも知れない。そこでMapReduceを手軽に試せるシステムとして開発されたのがAppengine Mapreduceだ。
Appengine MapreduceはGooglerが開発したソフトウェアで、Google App Engine上で動作する。テキストなどを分散化処理することができる。管理画面から処理を実行したり、結果のレポートを見られるようになっている。
結果画面
ローカルで動かしても良いが、やはりGoogle App Engine上で動かしてこそ真価が分かるというものだろう。概念としては分かっていつつも、やはり実体験を伴わないとなかなか理解は難しい。MapReduceが何なのか知りたければ、Appengine Mapreduceを実際に触って動かして結果を見てみることが一番だろう。
appengine-mapreduce - Project Hosting on Google Code