Appengine MapreduceはGoogle App Engine用Python製のオープンソース・ソフトウェア。Googleの基礎技術の一つであるMapReduce。膨大な文字列やデータを細かく細分化し、無数のコンピュータ上で並列処理させることで高速なシステムを実現する仕組みだ。

ピクチャ 79.png

実行画面

 

MapReduceはAmazon Webサービスにも真似されており(Amazon Elastic MapReduce)、有益さが分かっている。だが、どう使えば良いかが今ひとつ実感できないかも知れない。そこでMapReduceを手軽に試せるシステムとして開発されたのがAppengine Mapreduceだ。

Appengine MapreduceはGooglerが開発したソフトウェアで、Google App Engine上で動作する。テキストなどを分散化処理することができる。管理画面から処理を実行したり、結果のレポートを見られるようになっている。

ピクチャ 80.png

結果画面

 

ローカルで動かしても良いが、やはりGoogle App Engine上で動かしてこそ真価が分かるというものだろう。概念としては分かっていつつも、やはり実体験を伴わないとなかなか理解は難しい。MapReduceが何なのか知りたければ、Appengine Mapreduceを実際に触って動かして結果を見てみることが一番だろう。

 

appengine-mapreduce - Project Hosting on Google Code

 http://code.google.com/p/appengine-mapreduce/