集合知の凄さを見せつけてくれるWikipedia、日本でも数百万の記事が収録されているといった事がニュースになっていた。だが、日本語版の現状は他言語に比べるとどうなのだろう。

ピクチャ 1 Thumbnail-44

もちろん、各国版をそれぞれ見比べれば分かるだろうが、専用のアナライザーが存在する。

今回紹介するオープンソース・ソフトウェアはW.H.A.T、Wikipedia専用のアナライザーだ。

W.H.A.Tは各国版のWikpediaについて、横断してデータをグラフ化してくれる。例えば記事の数や、ユーザ数といった具合だ。日本はだいたい4番目だが、英語版が圧倒的に多い。

ピクチャ 2 Thumbnail-38

そしてユーザ数の推移もグラフ化している。こちらは2006年のデータなので、現状とは乖離している可能性があるが、興味深いものになっている。他にも、英語版の中でよく見られているページを円グラフで表示する機能もある。

各国版が存在するサービスは、その言語ごとに統計をとってみるとまた面白い。W.H.A.Tはその観点に基づいて開発されている。

W. H. A. T. - Wikipedia Hybrid Analysis Tool
 http://w-h-a-t.sourceforge.net/

SourceForge.net: W.H.A.T.: Wikipedia Hybrid Analysis Tool
 http://sourceforge.net/projects/w-h-a-t/
ピクチャ 3 Thumbnail-34
ピクチャ 4 Thumbnail-30