POPFileは、間違ったときだけ鍛えるという、一般的には “TOE” (訳注:Train Only on Errorsの頭文字) と呼ばれる方法をとることによって、いちばんよく働きます。POPFileが間違った分類をしたときにあなたが再分類を行うといったことが、ほぼそれにあたります。
代わりの、あまり一般的ではない方法として、常に鍛えるあるいは“TA”(訳注:Train Alwaysの頭文字)があります。この方法では、すべてのメッセージを再分類することになります。すでに正しい分類がされた場合でも、トレーニングを補強するために、同じバケツにメッセージを(手動で)再分類します、分類が間違っていた場合にも、正しいバケツに再分類します。この方法では、すべてのメッセージを、手動で再分類しなければならないので不便です。
調査では、TAはほんの少し正確なだけだということがわかっています。実際、TAをすることは、結果的にコーパスのサイズがとても大きくなり、コーパスが巨大化するにつれ、分類速度を低下させることになるでしょう。
加えて、もし複数の同一(あるいはほとんど同一)なメッセージが受け取られても、一般的にそれらの一つをトレーニングすれば十分です。これは、他の類似したメッセージの分類を変更しません。というのは、それらはすでにメールクライアントに受け渡されているからです。しかし、これから受信されるメッセージには影響を与えます。あるメッセージが、(他のメッセージが再分類されたあとに)違うバケツに分類されることになったかどうかについては、メッセージの詳細で確認することができます(POPFile 0.22 以降)。
参照:
Should you find anything in the documentation that is incomplete, unclear, outdated or just plain wrong, please let us know and leave a note in the Documentation Forum.