 +===== POPFile は新しい(コーパスにない)単語をどのように評価しますか? =====
 +POPFile はすべての単語について確率を計算します。コーパスに存在する単語については、コーパスから得られる確率をふつうに計算します。コーパスに存在しない単語については、1/(10 * そのバケツのコーパスの大きさ) という確率を割り当てます。言い換えれば、その単語は "ほとんど" あらわれないということを意味します。
 +他の選択肢としては、0 (すべてのバケツの確率が 0 になってしまって分類に失敗するでしょう)、あるいは 1 (その単語がいつも現れることを意味するので、分類ミスが起こるでしょう)があります。
 +[[FAQ:NewWords | 原文]]
