2011-01-25 19 views
0

私は難しい問題が私の前に横たわっており、私自身が攻撃の計画を立てる前にコミュニティからいくつかの指導を求めることを最善に思っていました。多数のXMLファイルのインデックスを作成

私は数千のXMLファイルをSQL Server 2008データベースで検索可能にする必要があります。 XMLファイルは現在ディスク上に存在し、リポジトリの一部ではありません。私は「検索可能」の意味することは、私は(ここでは擬似コード)のような何かをできるようにする必要があるということです

SELECT * 
FROM tbl_xmldata 
WHERE CONTAINS('xmldata', 'some search word') 

tbl_xmldata XMLファイルが保存されているテーブルになり、そしてXMLDATA列になります実際のXMLデータと比較します。

ヒットが見つかったとき(ヒットしたときにXMLファイルに検索対象の単語が含まれていることがわかったとき)、アクセス権が必要です検索用語が見つかった場所を囲む言葉に変換する。例えば、私はそれに次のように持っていたXMLファイルを持っていた場合:私たちはすべての人が < /ルート>

同じように作られていることを、これらの真理が自明であることを保持する

<ルート>と「自明」という言葉を検索したところ、検索用語の前後に約20文字を戻す必要がありました。とにかく私の経験では、SQL Serverのフルテキストインデックス作成は、特定のドキュメントに用語/単語/句があるかどうかだけを伝えることができるという点で制限されています(ドキュメントがSQL Server 2008のファイルストリーム)、語句/語句が配置されているコンテキストを示すことはできません。

ご協力いただければ幸いです!ありがとう!

+0

すべてのXMLファイルは同じスキーマを持っていますか? –

答えて

0

Solrプロジェクトをご覧ください。あまり成熟していないが非常に有望な代替手段はElastic Search

関連する問題