1

JSONデータを列に格納し、テキストフィールドではなく文書としてDSE検索で分析したいと考えています。Datastax(DSE)でJSONフィールドを分析する方法検索

彼らは共通のスキーマ(あるいはスキーマの任意の適度なサイズのセット)に追従していないので、私はテーブルにJSONのドキュメントを強制することはできません

私が現在持っていることは行って大きなテキストフィールドの上に働いてワイルドカード検索です不十分であり、より洗練された照会を可能にしない。

私はSOLR supports nested documentsを読んでいますが、ドキュメントがDSEに適用するには十分ではありません。そこno SOLR field type for nested docsになるようだと私はよう_childDocuments_のような名前をオブジェクトへの制限を適用する方法が分からない見here

それは私がどのように設定します、個別またはネストされた文書などとそうであればDSE検索ハンドルフィールド/列を持つことが可能ですそれを使用しますか?

+0

あなたはUDTを調べましたか?ここには本当に良いDatastaxの書き込みがあります。 http://www.datastax.com/dev/blog/tuple-and-udt-support-in-dse-search – mando222

+0

IIUCでは、UDTを定義するのにまだ残っているスキーマに準拠する必要があります。私が扱っているドキュメントの多くのオブジェクト名/キーは、私が予期できないハッシュだけです。それでも、UDTは、より一貫性のある構造を持つドキュメントのサブセットに対して適切な方向に向いている可能性があります。 – kostja

+0

@ mando222あなたは質問の答えを言い換えることができます - いいえ、DSE 5リリースでは、レコードに格納されたJSONドキュメントをネストされた/別のドキュメントとしてインデックス付けすることはできません。正しい? – kostja

答えて

2

ありがとうあなたはUDTが使用できない場合は、他のオプションがフィールド変圧器であるように私には思えます。 (下のリンク)

コメントの質問に答えるにはレコードに格納されたJSONドキュメントをネストされた/別のドキュメントとして索引付けすることは完全に可能です。ここでの主な問題は、データには何の凍結や理由がないように見えるということです。これにより、通常はJSONの構造を使用するスキーマを作成することが非常に難しくなります。私の理解が正しければ、実際にここで働く構造としては本当にありません。

http://www.datastax.com/dev/blog/dse-field-transformers

+0

ありがとう、mando222、これは私が残したことにさらに近く、残念なことにはるかに関与しています。ドキュメントには共通の静的要素があり、それらには一般的な名前の動的要素も含まれているため、スキーマにコミットすることはできません。残念ながら、私はあなたがそれに投げるすべてを喜んで索引をつけるelasticsearchによって甘やかされました:) – kostja

+0

cassandraのオープンソースelasticsearchがあります。私はそれを使用していないが、それはトリックを行うことがあります。 https://github.com/vroyer/elassandra – mando222

+0

エラサンドラはよく見えます、それが存在するかどうかはわかりませんでした。ポインタありがとう、mando222 – kostja

関連する問題