Differences
This shows you the differences between two versions of the page.
Both sides previous revisionPrevious revision | Last revisionBoth sides next revision |
jp:utilityscripts:insert [2007/05/23 19:29] – amatubu | jp:utilityscripts:insert [2007/05/23 19:32] – amatubu |
---|
**サンプルメールの数について** | **サンプルメールの数について** |
| |
このスクリプトを使ってメールサンプルで POPFile を鍛えるときには、サンプルメールの数に注意してください。この方法で POPFile に学習させるのはおすすめできません。このユーティリティはテストのために作成されたものです。もしこれを使って POPFile に学習させようとするのであれば、数千のメールを登録することを奨励**しません**。もしそうした場合には、分類精度の向上がほとんどない巨大なコーパスを抱えることになります。このユーティリティを使う場合最も良い方法は、最大でもバケツごとに 100 通程度の少ない特徴的なサンプルを使うようにすることです。POPFile はすぐに学習しますから、このユーティリティを使う必要はありません。また、推奨される [[jp:glossary:toe|TOE(間違ったときにだけ学習させる)]] という方法をとった場合よりも精度が低くなるでしょう。TOE をシミュレートした [[http://popfile.jciv.com/xmltraintest.html|TrainTest.py]] を見てみるのがよいでしょう。 | このスクリプトを使ってメールサンプルで POPFile を鍛えるときには、サンプルメールの数に注意してください。この方法で POPFile を鍛えるはおすすめできません。このユーティリティはテストのために作成されたものです。もしこれを使って POPFile を鍛えようとするのであれば、数千のメールを登録することは奨励**しません**。もしそうした場合には、分類精度の向上がほとんどない巨大なコーパスを抱えることになります。このユーティリティを使う場合最も良い方法は、最大でもバケツごとに 100 通程度の少ない特徴的なサンプルを使うようにすることです。POPFile は短期間で学習しますから、このユーティリティを使う必要はありません。また、推奨される [[jp:glossary:toe|TOE(間違ったときにだけ鍛える)]] という方法をとった場合よりも精度が低くなるでしょう。TOE をシミュレートすることができる [[http://popfile.jciv.com/xmltraintest.html|TrainTest.py]] を見てみるのもよいでしょう。 |
| |
===== 使い方 ===== | ===== 使い方 ===== |
| |
[[:JP:UtilityScripts | ユーティリティ・スクリプト]] | [[:JP:UtilityScripts | ユーティリティ・スクリプト]] |
| |