(固有)単語数((unique) word count)ってなんですか?

メッセージを再分類したとき、POPFile はメッセージに含まれていた単語を分類されたバケツの単語リストに追加します。このリストには、単語がそのあらわれた回数と一緒に記録されています。したがって、”viagra” という単語がメッセージに 100 回含まれているメッセージを spam に再分類した場合、ひとつの viagra という単語の回数が 100 加算されることになります。

バケツタブの「サマリー」欄には、それぞれのバケツの単語リスト(”同じ単語はひとつにまとめられたリスト”)に含まれる重複を除いた単語の数(固有単語数)が表示されます。また、「単語数」欄には、それぞれのバケツに含まれるすべての単語の合計が表示されます(重複も含めてすべて数える)。

原文

 
jp/glossary/wordcount.txt · Last modified: 2008/02/08 19:49 (external edit)

Should you find anything in the documentation that is incomplete, unclear, outdated or just plain wrong, please let us know and leave a note in the Documentation Forum.

Recent changes RSS feed Donate Driven by DokuWiki
The content of this wiki is protected by the GNU Fee Documentation License