2017-01-17 11 views
0

私たちはチームワークを使ってペルシア語の検索エンジンを作成しています。 私は「索引付け」の部分をやっています。 私はSolrと一緒に作業し、いくつかの英語のドキュメントを索引付けして動作するかどうかを確認しました。 それは働いた!ペルシャのインデクサのための時間です。私はPersianAnalyzer用のコードを少し最適化しました(例えばストップワードを拡張しています)。ここで、外部のペルシア語のインデックス付きドキュメントをコアにインポートして、インデックス作成プロセスを見て、それに対するクエリを検索します。これらのインデックス付きドキュメントをコアにインポートするにはどうすればよいですか? 私は何か急いでいるので、私はどんな助けにも感謝します。solrコアでインデックスされたドキュメントの外部ファイルをインポートする方法

おかげで、 Mahshid

答えて

0

あなたは、いくつかのオプションがあります:SolrのDataImportHandlerを使用することですファイルからコンテンツを取得するために

  1. 最速のオプションを。
  2. 別のオプションは、カスタムクローラ/インデクサを作成することですが、それには時間が必要です。
  3. ウェブクローラーが必要な場合はApache Nutchを使用できます。
関連する問題