テキストコンテンツは世の中にあふれています。そうしたコンテンツを収集するのは容易ですが、次はうまく分類分けして表示しなければなりません。そこで使えそうなのがbayonです。高速なクラスタリングを実現するソフトウェアです。 0
![]()
インストールします。configure、make、make installで完了です。
0
![]()
ヘルプです。
0
![]()
サンプルのファイルです。左がIDで、それに続く右側が属性となっています。
0
![]()
実行しました。100分割なので全てばらばらに検出されています。
0
![]()
例えば上記例では2つのグループにクラスタリングされています。
0
![]()
3つの場合のクラスタリングです。
0
![]()
中心ベクトルを求める方法です。
0
bayonは特徴的なキーを自動判別したり、クラスタリングの手法を変更することもできます。デフォルトではRepeated Bisection法ですが、K-meansを利用するように変更できます。bayonの特徴は高速さとシンプルな構成にあります。実際、使い方はとてもシンプルです。 0
bayonはGPL v2のオープンソース・ソフトウェアです。
プレミアムユーザには“MOONGIFTはこう見る”、記事の一行概要、追加スクリーンショット、デモや追加URLが表示されます。登録(500円/月)はこちらから! プレミアムユーザのログインはこちらから 0
bayon - a simple and fast clustering tool - Google Project Hosting 0












アンケート