私は逆索引作成に取り組んでいます。これは文書コレクションを索引付けし、各用語を情報とともに格納し、その参照を投稿ファイル(文書ID、場所など)に格納します。逆索引のファイル形式
現在、私はそれを.txtファイルに格納しています。このファイルは、.txtファイルに関係するすべてのクエリに対して文字列マッチングを必要とします。
私はリンクされたリストスタイルのデータ構造のようなファイルにその情報を保存します。これはこのタイプのシナリオのために可能です....(また私はインデックス作成のためにPHP言語を使用しています)。
ありがとうございます、ありがとうございます。
現在、私のデータは.txtファイルに格納されています。データを取得する際にテキストマッチングが必要です。だから基本的には、どのようにマッチング処理を減らし、直接用語をつけたり、リスト情報を投稿するかを知りたがっています....ありがとう。 –