ベイズ理論をベースにしているという点では同じです。しかしベイズ理論はそもそも非常に単純な原理で、以下のたった一つの式に集約されてしまいます。
P(A|B) = P(A) * P(B|A) / P(B)
そこで、この理論をスパムフィルターとしてどのように実装するかで、各ソフトウェアで異なる工夫が施され、ゆえに学習効果もソフトごとに違ってきます。
POPFile は、スパムと非スパムの2つのカテゴリーに分ける単なるスパムフィルターではなく、ユーザーが好きなだけカテゴリーを作ることができ、そのカテゴリーにメールを振り分けることができるメール分類ソフトとして開発されました。当然スパム・非スパムの分類だけに的を絞ったものよりも学習速度が遅くなるのですが、そのわりには依然高い学習効果を維持しているのは色々と細かい工夫がされているからです。例えば、0.21.0 から追加されたスタイルシート(CSS)の解釈もその工夫のうちの一つです。
また、日本語メールへの対応と一口に言ってもその方法にはいくつかの方法あり、
があります。このうち POPFile では 1. を採用しており、形態素解析システムとして Kakasi を使用しています。
参照:
Should you find anything in the documentation that is incomplete, unclear, outdated or just plain wrong, please let us know and leave a note in the Documentation Forum.