2016-05-07 4 views
0

私はこのデータセットに、世界の二国間貿易データを数年間保管しています。 私は、どの商品がデータセットによって考慮されるタイムスパンで最も輸出されたものであるかを判断したいと思います。変数の観測を整理しランク付けする方法は?

データセットは以下の変数によって構成されています

  • 「年」
  • 「HS2」、
  • 「exp_val」エクスポートされた良い告げる2桁の数字を含む与えますその良い
  • 「exp_qty」のために、特定の年の輸出の値は、特定の年には良いのエクスポート量を与える

基本的に、私は等、特定の利益のためにエクスポート量、

hs2 exp_qty 
01 34892 
02 54548 
... ... 

ようなので、出力の総和を取得したいと思います。今、列 "hs2"は私に非常に多くの観測をもたらし、理解できるように、変数は複数回繰り返されます(変数は時間と目的地の両方で異なります)。したがって、「総」輸出の特派員の価値とともに、すべてのhs2番号を1回だけ持つことが課題です。

また、exp_qtyでソートされた結果を得ることができれば、最も多く輸出された商品を数量でランキングすることができればプラスになるはずです。

答えて

1

以下は、あなたが必要とするところから始まるかもしれません。

collapse (sum) exp_qty, by(hs2) 
gsort -exp_qty 

collapse exp_qtyの値を加算、HS2の値ごとに観察し、メモリ内のデータをまとめたものです。 gsortは、降伏値をexp_qtyに降順でソートし、最初の観測値が最大になるようにします。詳細については、help collapseおよびhelp gsortを参照してください。

+0

助けてくれてありがとう、それは完璧に働いた! 正確に必要なもの – scoglio

関連する問題