Differences

This shows you the differences between two versions of the page.

jp:howtos:training [2008/02/08 19:49] (current)
Line 1: Line 1:
 +====== POPFile のトレーニング ======
 +
 +何もしていない最初の状態では、POPFile は全く賢くありません。スパムメールが何であるか知りませんし、電子メールが何であるかさえ、設定されたバケツが何を意味するのかさえ知りません。POPFile をトレーニングするには少しばかりの時間がかかります。どうして POPFile はスパムメールを認識できるようにあらかじめトレーニングされていないのか?それはメールの分類が主観的な行為だからです。もしあなたが医者だとすると、他の人にとってはスパムの高い指標となるような単語(薬に関する単語)を多く含んだ重要なメールを受け取る可能性があるでしょう。POPFile は使用する人に応じて学習するため、非常に正確な能力を発揮します。
 +
 +===== POPFile が間違いを犯したら (...それは確実に起こります!) =====
 +
 +POPFile の分類システムは、有効に働くまでしばらく訓練する必要があります。訓練すればするほど効力が上がります。実際、一番最初はメールを分類することさえしません。//unclassified//(未分類)のままにしておきます。POPFilev0.20 のデフォルトの設定では、バケツ B よりもバケツ A の確からしさが 100 倍以上でないときにメッセージを unclassified(未分類) と判断します。この機能は [[JP:Glossary:FalsePositive | 誤検出]] の比率を抑えるためにあります。もしこの値を変えたい場合には、[[http://127.0.0.1:8080/advanced| 詳細設定タブ]] の **bayes_unclassified_weight** を変更して下さい。
 +
 +POPFile が電子メールを間違って分類する度に、あるいは全く分類しない度に、web インターフェース上の「履歴」タブ(デフォルトで開きます)を確認してください。そこには、最近受け取った20通かそこらのメールが、POPFile がどのように分類したかという情報とともに表示されています。(POPFile がなぜ電子メールをそのように分類したのかをもし見たければ、件名をクリックしてください。) [[JP:Glossary:TOE | 間違って分類されたメールそれぞれに対して]]、右側の列から正しい分類先を選択し、[再分類] ボタンをクリックして POPFile の間違いを正してください。(もし望むなら、同じページ上の複数のメッセージの分類先を一度に変更することができます。それには、変更したいメッセージ全ての分類先を指定し、[再分類] ボタンをクリックします。)
 +
 +これらのメールはすでに保存されているので、POPFile の分類に影響を与えることなく、メールソフト上で自由に移動したり削除したりして構いません! POPFile はメールの再分類が行われたときにだけ学習します。POPFile は 「if it ain't broke, don't fix it」(壊れていないものを直す必要がない)というセオリーに従って動いているのです。
 +
 +===== 簡易ガイドライン =====
 +
 +  - **POPFile には充分な時間を与えましょう。** 訓練すればするほど //効力// が上がります。
 +  - 間違いを起こす度に POPFile を正してやりましょう。もし2通のメールが間違って分類されたら、例え似たような内容でも2通とも再分類します。
 +  - [[JP:Glossary:AMagnet | マグネット]] はあまり使用しないようにします。POPFile はマグネットにマッチしたメールからは学習しないので、マグネットを利用して楽して正しい分類結果を得ようとすれば、実際には POPFile の分類精度を上げる機会を失う結果となります。
 +  - もし本当にそうしたいなら、単なる **スパム** と **非スパム** の分類以上のことに POPFile を使ってみましょう。最小バケツ数の2個と3,4,7あるいは12個のバケツとの間に現れる精度の差は大したことはありません。たくさんのバケツを作ればそれだけ多少はトレーニングに時間がかかるようにはなりますが、2個のときと比べると生じる差はそれほど大きくはありません。
 +  - バケツを定義したなら、どのようなメールをそこに分類するのかしっかりとした指針を持つことです。もし常にメールの分類先を迷って、あるときはこちらのバケツ、あるときはあちらのバケツ、というようにはっきりした分類を行っていないと、POPFile はいつまでたっても自動で正確な分類を行うようにはならないでしょう。
 +
 +参照:
 +
 +  * [[JP:FAQ:WhatIs     | POPFile って何ですか? ]]
 +  * [[JP:FAQ:WhenGood   | POPFileが適正な精度に達するにはどれぐらいかかりますか? ]]
 +  * [[JP:FAQ:EmailSorting | POPFileはメールを分類しているのにinboxに入っています。なぜspamフォルダに入らないのですか? ]]
 +
 +[[HowTos:Training | 原文]]
 
jp/howtos/training.txt · Last modified: 2008/02/08 19:49 (external edit)

Should you find anything in the documentation that is incomplete, unclear, outdated or just plain wrong, please let us know and leave a note in the Documentation Forum.

Recent changes RSS feed Donate Driven by DokuWiki
The content of this wiki is protected by the GNU Fee Documentation License