私はタートルのトリプルを生成しています。すでに完全なデータセットは2GBです。私はほとんどのテストのために少数のKの小さなサンプルで作業します。次に、完全なデータセットについて定期的なテストを試みます。それは一切ロードされませんが、エラーがあるかどうかは私に分かります。タートルファイルの読み込み時にエラーの行番号を報告できますか(オントロジーツール)?
私のクイックテストは、ttlファイルをprotegeにロードすることです。私はProtege 5.2(Windows版)を使用しています。小さなサンプルにエラーはありません。しかし、私が大きなサンプル(protege)を作成すると、生成されたttlファイルが読み込まれ、エラーが表示されます。
• Level: INFO Time: 1504111914814 Message: ------------------------------- Loading Ontology -------------------------------
• Level: INFO Time: 1504111914815 Message: Loading ontology from file:/C:/Projects/gdelt/sample.ttl
• Level: INFO Time: 1504112075814 Message: Finished loading file:/C:/Projects/gdelt/sample.ttl
• **Level: ERROR Time: 1504112075818 Message: An error occurred whilst loading the ontology at GC overhead limit exceeded. Cause: {}**
• Level: INFO Time: 1504112075819 Message: Loading for ontology and imports closure successfully completed in 160995 ms
これは、これらのサンプルファイル - をロードするために非常に長い時間がかかることができ、それが唯一のエラーは問題があった場所の兆候なしであった私に語りました。だから私の現在のデバッグ方法はバイナリ検索です - ファイルが半分の大きさに生成されます。エラーがあるかどうかを確認し、差異を分割し、エラーをチェックし、エラーを簡単に検出できる数行に絞ります。これはです。本当に退屈です。どこに行こうとしているのかを報告するための方法はありますか?
もしそうでなければ、私は生成するトリプルの構文をチェックするために別のツールを使用できますか?
メモリが不足しているということは、入力にエラーがない可能性が高いことを意味します。オントロジがメモリ設定に対して大きすぎるということです – Ignazio