This is an old revision of the document!
insert.pl スクリプトは、サンプルのメールを特定のバケツに登録することによってコーパスを鍛えるためのものです。これらのサンプルのメールは、内容を分析され、内部的にあなたが指定したバケツに 再分類されます 。
サンプルメールの数について
このスクリプトを使ってメールサンプルで POPFile を鍛えるときには、サンプルメールの数に注意してください。この方法で POPFile に学習させるのはおすすめできません。このユーティリティはテストのために作成されたものです。もしこれを使って POPFile に学習させようとするのであれば、数千のメールを登録することを奨励しません。もしそうした場合には、分類精度の向上がほとんどない巨大なコーパスを抱えることになります。このユーティリティを使う場合最も良い方法は、最大でもバケツごとに 100 通程度の少ない特徴的なサンプルを使うようにすることです。POPFile はすぐに学習しますから、このユーティリティを使う必要はありません。また、推奨される TOE(間違ったときにだけ学習させる) という方法をとった場合よりも精度が低くなるでしょう。TOE をシミュレートした TrainTest.py を見てみるのがよいでしょう。
使用する前には、POPFile を終了させてください。このスクリプトを使う前に、POPFile を終了させてください。insert.pl はコーパスに単語を追加するという変更を行います。このスクリプトはPOPFile と同時に動かすべきではありません。それは、コーパスのデータベースが破損するのを避けるためです。
このスクリプトは、POPFile をインストールしたディレクトリで実行しなければいけません。Windows ユーザの場合は、DOS 窓を開いて POPFile をインストールしたディレクトリ(通常は c:\program files\popfile\ ですが、あなたのシステムでは違う場所かも知れません)に移動します。
cd "\program files\popfile\"
POPFile をインストールしたディレクトリに移動したら、以下のようにしてスクリプトを動かします。
ディレクトリ内のメッセージを登録します
perl insert.pl バケツ名 \メッセージへのパス\*.*
1つのメッセージを登録します
perl insert.pl バケツ名 メッセージのファイル名
Outlook/Outlook Express を使用している場合
メッセージは poptemp フォルダに .eml というファイルとして保存されます。これを以下のようにして insert.pl で登録することができます:
perl insert.pl バケツ名 \poptemp\*.eml
Eudora (または、MBOX や MBX スタイルのメールクライアント) の場合
perl insert.pl バケツ名 \Eudora へのパス\newsletters.mbx
Should you find anything in the documentation that is incomplete, unclear, outdated or just plain wrong, please let us know and leave a note in the Documentation Forum.