Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Next revision
Previous revision
jp:troubleshooting:corruptcorpus [2007/01/24 09:40] amatubujp:troubleshooting:corruptcorpus [2008/02/08 19:49] (current) – external edit 127.0.0.1
Line 1: Line 1:
 ====== コーパスの破損 ====== ====== コーパスの破損 ======
- 
-**この情報は SQLite を使用している POPFile 0.21 かそれ以上のバージョンのみに該当します。もしあなたが0.20.xからのバージョンアップに問題を抱えている場合は、[[JP:troubleshooting:CorruptCorpus020 | こちら]]を参照してください。** 
  
 もちろん、破損の可能性がないのが望ましいので、それを避けるためにできるあらゆることを行っています。 もちろん、破損の可能性がないのが望ましいので、それを避けるためにできるあらゆることを行っています。
Line 49: Line 47:
 3. SQLite ユーティリティーで、データベースを開きます 3. SQLite ユーティリティーで、データベースを開きます
  
-  * //sqlite popfile.db//<br> +<code> 
-  'SQLite version 2.8.12'<br> +sqlite popfile.db 
-  Enter ".help" for instructions<br+'SQLite version 2.8.12' 
-  * sqlite>+Enter ".help" for instructions 
 +sqlite
 +</code>
  
 4. そして、整合性チェックを実施します(コマンドの最後のセミコロンを忘れないでください) 4. そして、整合性チェックを実施します(コマンドの最後のセミコロンを忘れないでください)
  
-  * sqlite//pragma integrity_check;//<br> +<code> 
-  ok<br> +pragma integrity_check; 
-  sqlite><br>+ok 
 +sqlite> 
 +</code>
  
   * もし問題があれば、上記の例のような ok は現れないでしょう(データベースが非常に大きい場合、チェックに数秒以上かかり、すぐには 'ok' が表示されないでしょう)。   * もし問題があれば、上記の例のような ok は現れないでしょう(データベースが非常に大きい場合、チェックに数秒以上かかり、すぐには 'ok' が表示されないでしょう)。
Line 80: Line 82:
  
   * もしあなたが技術的に解決したいと思うなら、SQLite を使ってデータベースの内容をテキストファイルに出力し、それを戻すことで、壊れたコーパスの内容の復旧を試すこともできます。   * もしあなたが技術的に解決したいと思うなら、SQLite を使ってデータベースの内容をテキストファイルに出力し、それを戻すことで、壊れたコーパスの内容の復旧を試すこともできます。
-  *//sqlite popfile.db .dump >popback.sql// +<code> 
-  *//rename popfile.db corrupt.db// +sqlite popfile.db .dump >popback.sql 
-  *//sqlite popfile.db < popback.sql//+rename popfile.db corrupt.db 
 +sqlite popfile.db < popback.sql 
 +</code>
  
 これはコーパスのサイズに依存して時間がかかる処理ですから、SQLite を強制終了したり、killしたり**しない**で辛抱してください。さもないとまた破損したコーパスを作ってしまうことになります。 これはコーパスのサイズに依存して時間がかかる処理ですから、SQLite を強制終了したり、killしたり**しない**で辛抱してください。さもないとまた破損したコーパスを作ってしまうことになります。
  
   * ここで、データベースがどの程度壊れているかがわかりましたから、壊れたバケツを完全に削除するか、ユーティリティーによって回復できたバケツの単語でどうにかやっていくかを、あなたは選ばなければなりません。どちらが正しい答えというものはありません。どちらを選ぶかに関わらず、単語の消失という損害を被ることになるため、どちらの選択肢も魅力的ではありません。あなたにとって何が最善かを考えて決断するとよいでしょう。// 決断するときには、以下の事実を考慮しましょう。もし、バケツから多くのデータが失われた場合に、はじめからやり直して、POPFileを再トレーニングするのではなく、回復可能なものを保持するという判断をした場合、分類精度に悪い影響を与える結果となるバランスの悪いコーパスを作ってしまうかもしれないのです。多くの場合、バランスの悪いコーパスから回復するより、再トレーニングする方が簡単で迅速です。//   * ここで、データベースがどの程度壊れているかがわかりましたから、壊れたバケツを完全に削除するか、ユーティリティーによって回復できたバケツの単語でどうにかやっていくかを、あなたは選ばなければなりません。どちらが正しい答えというものはありません。どちらを選ぶかに関わらず、単語の消失という損害を被ることになるため、どちらの選択肢も魅力的ではありません。あなたにとって何が最善かを考えて決断するとよいでしょう。// 決断するときには、以下の事実を考慮しましょう。もし、バケツから多くのデータが失われた場合に、はじめからやり直して、POPFileを再トレーニングするのではなく、回復可能なものを保持するという判断をした場合、分類精度に悪い影響を与える結果となるバランスの悪いコーパスを作ってしまうかもしれないのです。多くの場合、バランスの悪いコーパスから回復するより、再トレーニングする方が簡単で迅速です。//
 +
 +===== 古いバージョン =====
 +
 +0.20.xからのバージョンアップに問題を抱えている場合は、[[JP:troubleshooting:CorruptCorpus020|バージョン 0.20.x のコーパスの破損]]を参照してください。
  
 [[TroubleShooting:CorruptCorpus | 原文]] [[TroubleShooting:CorruptCorpus | 原文]]
 
jp/troubleshooting/corruptcorpus.1169631622.txt.gz · Last modified: 2008/02/08 19:49 (external edit)
Old revisions

Should you find anything in the documentation that is incomplete, unclear, outdated or just plain wrong, please let us know and leave a note in the Documentation Forum.

Recent changes RSS feed Donate Driven by DokuWiki
The content of this wiki is protected by the GNU Fee Documentation License