lucene

1熱

1答えて

私はsolr 6.2.1を使用していますが、特定のブラックリストのある単語（濫用的な単語）を持つすべてのドキュメントをsolrで省略します。私は誰もがSolrの上でインデックス化して保存するブラックリストに言葉を省略するために私を助けることができるschema.xml- <!-- A text field that only splits on whitespace for exact match

0熱

1答えて

Java：Luceneのインデックスを空にする_0.fdtと_0.fdxファイルのサイズは0kbです

私はこれをインターネットで閲覧していますが、正しい用語で検索することはできません。私の問題は、Luceneが空の_0.fdtと_0.fdxファイルをサイズ0kbでインデックスすることです。これは私のデータをインデックス化しなかったことを意味します。私は、出力ファイルのこの種を取得するために間違ってやっている知らない private int indexDocs(String dataTmp){

0熱

1答えて

どのシナリオでは、Lucene文書でField.StoreとField.Indexの両方が「NO」に設定されている必要がありますか？

私はField.storeまたはField.IndexのいずれかがNOに設定されている場合Field.storeとField.Indexはluceneの文書とユースケースの意識に何を意味するのかを認識しています。最近では、両方ともNOに設定されていると、コードの一部に遭遇しました。誰もが例を使ってユースケースを説明してもらえますか？NO？に設定する必要があります。 PS：私はthisを参照しまし

1熱

1答えて

Lucene 6.6.0の索引時間フィールドレベルのブースティング？

Lucene 6.6.0以降では、フィールドレベルのインデックス時間の昇圧はdeprecatedです。ドキュメントの状態：インデックスタイムのブーストが廃止され、してくださいインデックスindex-時間DOC値フィールドに要因を得点し、例えばを使用して問合せ時にスコアと組み合わせます。 FunctionScoreQuery。以前1はそうのような索引付け時にフィールドを後押しします： Fi

0熱

1答えて

ES検索に失敗しましたイタリア語のアナライザ

私のアプリケーションでは、私は検索のローカリゼーションをサポートしています。私は弾性検索を使用していますが、私はイタリア語のアナライザーを使用することに問題があります。他のアナライザは正しく動作しますが、イタリアンアナライザだけが次のエラーを発生させることに注意してください。 { "total": 25, "successful": 20, "failed": 5,

0熱

1答えて

Solrは文書内のフィールドをどのようにフィルタリングしますか

現在、〜5000個のフィールド/文書を持つコレクションでPOCを実行しています。すべてのフィールドに（格納され、属性がtrueとしてインデックス付けされています）。私は一致する文書のそれぞれ〜5つのフィールドだけを表示することに興味があります。私は、Solrが一致したドキュメントのすべての〜5kフィールドを.fdtファイルからメモリに持ち込み、残りのフィールドを捨てて、興味のあるフィールドを5つ

0熱

2答えて

ルシェンでの検索に正規表現を使用できません

私はテキスト、単語ファイルを索引付けし、これらのファイル内のいくつかのコンテンツを検索しようとしています。特定の文字列を検索しても問題ありませんが、正規表現を使用して検索すると、それ以上は機能しません。以下では、説明するための重要なコードをいくつか挙げます。インデックス機能：私は、クエリを構築するためにqueryParseを使用しています // FileBean is the class con

0熱

1答えて

動的条件としてLuceneフィルタを追加するには？

まず、私の質問のタイトルはあいまいですが、私は言い方が分かりません。あなたは私の例を見ると分かります。 SQLクエリでは、 '1 = 1'の動的条件を適用できます。例を挙げておきます。 select * from PROD.EMPLY WHERE 1=1 AND (NAME = 'JOHN' OR NAME = 'MARY' OR NAME = 'KEVIN') ; 上記のように、以下の

1熱

1答えて

Luceneの索引付けのためのPDFからテキストを効率的に抽出する

Apache Tikaを使用してPDFファイルからテキストコンテンツを抽出し、索引付けのためにLuceneにデータを渡そうとしています。 public static String extract(File file) throws IOException, SAXException, TikaException { InputStream input = new FileInputS

1熱

1答えて

elasticsearchに直接文字列または数値トークンを格納する必要があります

elasticsearchにイベント情報を保存する方法を決定できません。情報はmysqlに格納されていますので、フィルタリング可能にしたいので、私はelasticsearchを使用してイベントのインデックスを作成することに決めました。各フィールドにはオプションの数が限られていますが、複数のオプションが許可されています。 { "id":"1", "name":"Event A",