solr4

0熱

1答えて

solerでTesseractを設定する6.4.1

solfでTika OCRを設定する方法6.4.1。 PDF、画像、MSオフィス文書を含む文書を索引付けしましたが、問題が発生しました。Tikaは画像からテキストを抽出していなかったし、PDF文書とMSオフィス文書の中にある画像も抽出していませんでした。このため私はTika OCRを研究しました。この目的のために私はtika-app-1.7.jarとTesseractをインストールしていますが、

0熱

1答えて

インデックスフィールドの削除に影響しないインデックスサイズ

私の詳細を格納するためにsolr 4を使用しています。私のコレクションに1cr以上のレコードがあります。各レコードには、ほぼ2000のインデックスフィールドがあります。私のsolrのインデックスサイズはほぼ18GBです。いくつかの日前に、次のコードを使用して1525以上のインデックス付きダイナミックフィールドを削除しました： data_json = [{"id": 12, "field_t

0熱

1答えて

SolrNetでCurlコマンドを使用する

curl "http://localhost:8983/solr/QNB_ARABIC/update/extract?literal.id=doc1&commit=true" -F "[email protected]_file.pdf" これは、curlコマンドで、これを使用してドキュメントをsolrに送ることができます。私はcmdを使っていますが、solrNetからこのコマンドを実行したいと

0熱

1答えて

Solr：すべてのドキュメントに新しいフィールドを追加する方法

Solrインデックスの各ドキュメントに新しいフィールドを追加する必要があります。この新しいフィールドは検索可能である必要はありません。 Solrに格納するだけで検索結果に戻すだけです。新しいフィールドの値は、idフィールドに基づいて算出することができる（とSolrのインデックスに存在しない他の情報。）この目標を達成するための最速、最も簡単な方法は何ですか？

0熱

2答えて

Solr Searching - クエリを使用して

「Red And Carpet」、「Red and Blue」、「Blue and Red」、「Red In White」、「Blue in Red」などのタイトルを持つドキュメントがあります。 "ブルーレッド"のタイトルに対して検索を行いたいと思います。ブルーとレッドワードの両方が利用可能なドキュメントを返す必要があります。上記のタイトルによると、 "赤と青"、 "青と赤"、 "青い赤"が返さ

0熱

2答えて

solrを使用してリモートサーバに "synonyms.txt"というファイルをロードする方法はありますか？

<analyzer type="query"> <tokenizer class="solr.StandardTokenizerFactory"/> <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt"/> <filter class="solr.SynonymFilterFactory"

0熱

1答えて

"OMG！*"を検索するとSolrが空の結果を返す

drupal-7と検索APIを使用してsolr 4.9を使用して1つの問題に直面しています。感嘆符（！）の組み合わせで検索すると、solrは空の結果を返します。例えば： http://localhost:8983/solr/collection1/select?q=OMG!*&wt=json 上記のクエリが空の結果を返します。しかし、文書内のこの単語にデータがある：私は言葉を開始する探してい

1熱

2答えて

SOLRクエリsimilarto NOT IN（LIST）

私たちはSOLRインデックスから得意NOT IN（IDのインデックスのリスト）を同様の値を取得する必要がある要件を持っています。どのようにsolrクエリを使用してこれを達成できますか？

2熱

1答えて

Solrの変更文字列フィールドは

背景を多値整数に：によると [dspace]/bin/dspace stats-util -s ：私は、dSPACEのコマンドを使用して、私の統計Solrのコア年でシャーディングを実行する。その後 https://wiki.duraspace.org/display/DSDOC5x/SOLR+Statistics+Maintenance#SOLRStatisticsMaintenance-So

1熱

1答えて

ドイツ語の停止語がJBossサーバーのsolrに特殊文字を使用していない

JBoss 7サーバーでSolr 4の検索を行い、英語の停止語を設定しようとしています&ドイツ語です。ストップワードのための私の構成は以下のとおりです。 <fieldType name="text_copy" class="solr.TextField" autoGeneratePhraseQueries="true" positionIncrementGap="100"> <analyzer