Orangeは統計の設計をビジュアル的に行うことが出来るソフトウェア。

OrangeはWindows/Mac OSX/Linux用のオープンソース・ソフトウェア。マーケティングやシステムの解析を行う際にはデータを並べ替えたりグルーピングしたりしてそこから何らかの法則を見いだしていく。その結果は表であったりグラフとして現される。


設計画面

数字を眺めているだけでは分からなかった法則がビジュアル化することによって見いだせる可能性がある。そのためには様々な角度から抽出したデータを組み合わせなければならない。その補助となるソフトウェアがOrangeだ。

Orangeはデータを様々な統計的手法および解析を通じて分析し、グラフに表示するソフトウェアだ。面白いのは各解析機能がコンポーネント化されており、ドラッグアンドドロップとインプットとアウトプットを結びつけることで関連性を定義できる点だろう。


コンポーネント設定

まるでYahoo! Pipesのような感覚でデータマイニングを行うことが出来る。ビジュアル的に定義できるので、元データさえあればシステムに詳しくない人であっても解析用語を知っていれば分析が実現する。さらにPythonによってスクリプトで拡張することもできる。解析を得意とする人には便利なツールになりそうだ。

[s2If current_user_can(access_s2member_level1)]


解析の一例(Last.fmのデータから作成したネットワーク図。公式サイトより)(プレミアム限定)

[/s2If]

MOONGIFTはこう見る

見た目はアイコンが並んで分かりやすいインタフェースになっているが、実際の操作は統計を適切に行える人でないと扱える代物ではない。多数のデータソースからデータをサンプリングしたりクラスタリングしてグラフを出力するといった解析手法を駆使できるのがOrangeの面白さだ。

ちょっとしたデータの解析であれば表計算やデータベースを使って十分な結果を得ることが出来るだろう。そのような枠に収まりきらない、複雑な解析を行う必要がある時にはOrangeが役立つはずだ。

Orange - Data Mining Fruitful & Fun