注目キーワード

MOONGIFT

OSSを中心としたメディアポータル

Cloud CrowdはRuby製のオープンソース・ソフトウェア。大量のデータを処理しようと思った時にはMapReduceのような仕組みに注目が集まる。テキストのみならず、大量のOCR処理が必要になったり画像をサムネイル化したいといった時にはどのようなシステムを構築するのだが良いだろうか。 0

ピクチャ 11.png
Rubyを使って分散処理 0

 

一時的に無数のシステムを立ち上げ平行で処理を走らせる時に注目したいのがAmazon EC2だ。以前、ニューヨークタイムズでは1,100万枚を越える画像をPDFに変換するという処理をAmazon EC2のインスタンスを100立ち上げて行ったという事例がある。どうようのシステムを構築するのがCloud Crowdだ。 0

Cloud Crowdも利用するのはAmazon EC2だ。アクションはRubyで定義するようになっており、テキスト処理のみならず画像変換などの柔軟なシステム処理が可能になっている。特徴的なのはCloud Crowdが管理インタフェースとしてローカルでサーバを立ち上げるということだ。そしてキューの処理やインスタンスの状況についてグラフ化し、刻々とステータスを更新する。 0

ピクチャ 12.png
コマンドヘルプ 0

 

立ち上げるインスタンスの数などは設定ファイルで管理できる。処理データの授受はAmazon S3を使って行うようになっている。Amazon Web ServiceでもHadoopベースのAmazon Elastic MapReduceというサービスがあるが、Cloud Crowdの方がより柔軟に処理が指定できそうだ。 0

Amazon EC2は常時立ち上げておく場合はもちろん、このような一時的な処理を行う場としても最適だ。そしてその管理インタフェースとしてCloud Crowdもまた便利なソフトウェアだ。 0

 

documentcloud's cloud-crowd at master - GitHub
 http://github.com/documentcloud/cloud-crowd 0

MOONGIFTの関連記事

このエントリーを含むTwitter

Related Posts Plugin for WordPress, Blogger...
新規購読
新規購読

プレミアムでしか読めない記事が160あります。ぜひ登録を!

  • オープンブロックス - OpenBlockS
  • 広告募集

ぷらっとオンラインおすすめ商品もっと見る

もっと見る

人気記事もっと見る