私はSolr 4.10.4を持っており、xmlファイルのインデックスを作成したいと思います。 Somes xmlタグにはHTMLタグが含まれています。Solrインデックスxmlファイル、htmlタグ付き(DataImportHandler付き)
<?xml version='1.0' encoding='UTF-8' standalone='no' ?>
<root>
<info>
<text>
<p>text 1</p>
<p>text 2</p>
<p>text 3</p>
</text>
</info>
</root>
私はこれを使用:
<charFilter class="solr.HTMLStripCharFilterFactory"/>
をしかし、それは動作しませんし、私が間違っているかわかりません。
M.
** solr.HTMLStripCharFilterFactory **は、インデックス付きデータからhtmlタグを削除します。保存された値も変換しますか? –