POPFile

スパム vs ベイズ

POPFile ロゴ

ある日突然舞い込むメール。件名は「未承諾広告」、いわゆるスパムメールだ。インターネット上に重要なメールアドレスは載せていないのだが、やってくる。非常に迷惑だ。

中国に限った話では、昨年送られたスパムメールは1,500億通に達したそうだ。ちなみにその内の60?80%はサーバにて処理されたが、それでも470億通余りはユーザへ配信されたらしい。ネットワークインフラへの過剰な負荷となりつつある。更に、AOLやMSNは迷惑メールへの対応を強める事を表明しなければならない程、企業側でもコストが発生する存在になりつつある。

そんな厄介なスパムメールであるが、一つの解があるかも知れない。本日紹介するオープンソース・ソフトウェア、POPFileがそれだ。日本語化を推進しているjishiha氏からご紹介に預かった、非常に面白いソフトウェアだ。

POPFileが採用しているフィルタリングはベイズの原理と呼ばれ、Google、インテル、Microsoftも注目する理論だ。簡単に言えば、未来の予測は過去の統計を以って可能であると言う事だ。非常に単純ではあるが、真理を突いているように感じられる。つまり過去のメールについて分析を行う事で、新しいメールに対しても正しい判別が下せると言う事なのだ。

ポイントとして、日本語対応が挙げられるだろう。日本語は単語間のスペースがない等、英語圏とは違う特徴がふんだんにある。日本語対応している点は大きい。更にPerlで書かれ、Webインタフェースでの管理によって、Windows、Linux、そしてMacintoshでも動作する事が嬉しい。

メールは便利な反面、一通当たりの配信コストが余りに安いため、良からぬ利用法が蔓延している。また、インターネットはアメリカの文化圏で生きている、つまり自己防衛が求められているのだ。POPFileはあなたのメール環境を守るため、役立つに違いない。

http://popfile.sourceforge.jp/