のは、私がデータハイブで二重区切り文字を使用するにはどうすればよいですか?
私は テーブルclicklogs(サイト名の文字列、URL文字列)「^」で終了 ROW形式区切られたフィールドを作成するようにテーブルを作成したいsite1^http://article1.com?datacoll=5|4|3|2|1&test=yes
site1^http://article1.com?test=yes
site1^http://article1.com?datacoll=5|4|3|2|1&test=yes
のいくつかのサンプル行を持っているとしましょう。
あなたは私がURLパラメータのいくつかのデータを持って見ることができるように私は、抽出したいつまり datacoll = 5 | 4 | 3 | 2 | 1
私も区切らこれらの個々の要素で仕事をしたいですパイプで、私はそれらの2つの行である "4"の2番目の位置を持っていた例をいくつかのURLを表示するためにグループバイスを行うことができます。したがって、この場合、私は「url」フィールドに追加のデータがあり、これを解析してクエリに使用したいと思います。
質問は、ハイブでそれを行う最善の方法は何ですか?
ありがとうございました!
完璧に感謝しました! – James