0
私は豚のファイルに対してメディアン操作をしようとしています。ファイルは次のようになります。私の豚ラテンスクリプトのバグ
NewYork,-1
NewYork,-5
NewYork,-2
NewYork,3
NewYork,4
NewYork,13
NewYork,11
Amsterdam,12
Amsterdam,11
Amsterdam,2
Amsterdam,1
Amsterdam,-1
Amsterdam,-4
Mumbai,1
Mumbai,4
Mumbai,5
Mumbai,-2
Mumbai,9
Mumbai,-4
ファイルがロードされ、次のように内部のデータがグループ化され、次のような都市のすべての温度から中央値を取得しようとして
wdata = load 'weatherdata' using PigStorage(',') as (city:chararray, temp:int);
wdata_g = group wdata by city;
イム:
wdata_tempmedian = foreach wdata_g { tu = wdata.temp as temp; ord = order tu by temp generate group, Median(ord); }
中央値を見つけるためにソートされた順序でデータが必要であるため、データが順序付けされています。すべてのヘルプははるかに高く評価されて
[main] ERROR org.apache.pig.tools.grunt.Grunt - ERROR 1200: <line 3, column 53> mismatched input 'as' expecting SEMI_COLON
: しかし、イムは、私が間違いであるかを把握できなかった次のエラーメッセージを取得します。
はいを登録されている中央値function.Ensureを持っていないので、あなたはデータ-FUを使用していると仮定しています働いた。 – Sidhartha