solr4

    0

    1答えて

    solfでTika OCRを設定する方法6.4.1。 PDF、画像、MSオフィス文書を含む文書を索引付けしましたが、問題が発生しました。Tikaは画像からテキストを抽出していなかったし、PDF文書とMSオフィス文書の中にある画像も抽出していませんでした。このため私はTika OCRを研究しました。この目的のために 私はtika-app-1.7.jarとTesseractをインストールしていますが、

    0

    1答えて

    私の詳細を格納するためにsolr 4を使用しています。 私のコレクションに1cr以上のレコードがあります。 各レコードには、ほぼ2000のインデックスフィールドがあります。 私のsolrのインデックスサイズはほぼ18GBです。 いくつかの日前に、次のコードを使用して1525以上のインデックス付きダイナミックフィールドを削除しました: data_json = [{"id": 12, "field_t

    0

    1答えて

    curl "http://localhost:8983/solr/QNB_ARABIC/update/extract?literal.id=doc1&commit=true" -F "[email protected]_file.pdf" これは、curlコマンドで、これを使用してドキュメントをsolrに送ることができます。 私はcmdを使っていますが、solrNetからこのコマンドを実行したいと

    0

    1答えて

    Solrインデックスの各ドキュメントに新しいフィールドを追加する必要があります。 この新しいフィールドは検索可能である必要はありません。 Solrに格納するだけで検索結果に戻すだけです。 新しいフィールドの値は、idフィールドに基づいて算出することができる(とSolrのインデックスに存在しない他の情報。) この目標を達成するための最速、最も簡単な方法は何ですか?

    0

    2答えて

    「Red And Carpet」、「Red and Blue」、「Blue and Red」、「Red In White」、「Blue in Red」などのタイトルを持つドキュメントがあります。 "ブルーレッド"のタイトルに対して検索を行いたいと思います。ブルーとレッドワードの両方が利用可能なドキュメントを返す必要があります。 上記のタイトルによると、 "赤と青"、 "青と赤"、 "青い赤"が返さ

    0

    2答えて

    <analyzer type="query"> <tokenizer class="solr.StandardTokenizerFactory"/> <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt"/> <filter class="solr.SynonymFilterFactory"

    0

    1答えて

    drupal-7と検索APIを使用してsolr 4.9を使用して1つの問題に直面しています。感嘆符(!)の組み合わせで検索すると、solrは空の結果を返します。 例えば: http://localhost:8983/solr/collection1/select?q=OMG!*&wt=json 上記のクエリが空の結果を返します。しかし、文書内のこの単語にデータがある:私は言葉を開始する探してい

    1

    2答えて

    私たちはSOLRインデックスから 得意NOT IN(IDのインデックスのリスト)を同様の値を取得する必要がある要件を持っています。 どのようにsolrクエリを使用してこれを達成できますか?

    2

    1答えて

    背景を多値整数に:によると [dspace]/bin/dspace stats-util -s :私は、dSPACEのコマンドを使用して、私の統計Solrのコア年でシャーディングを実行する。その後 https://wiki.duraspace.org/display/DSDOC5x/SOLR+Statistics+Maintenance#SOLRStatisticsMaintenance-So

    1

    1答えて

    JBoss 7サーバーでSolr 4の検索を行い、英語の停止語を設定しようとしています&ドイツ語です。ストップワードのための私の構成は以下のとおりです。 <fieldType name="text_copy" class="solr.TextField" autoGeneratePhraseQueries="true" positionIncrementGap="100"> <analyzer