2017-04-16 1 views
1

私はデータフレームp1を持っています。列aに転記したいと思います。各行の最小値を見つけ、最小値を持つ列名を返します。列ごとにデータフレームを転置し、列の最小値とインデックスを返します。

a=c(0,1,2,3,4,0,1,2,3,4) 
b=c(10,20,30,40,50,9,8,7,6,5) 
p1=data.frame(a,b) 
p1 


> p1 
    a b 
1 0 10 
2 1 20 
3 2 30 
4 3 40 
5 4 50 
6 0 9 
7 1 8 
8 2 7 
9 3 6 
10 4 5 

最終的に必要な答え

0 1 2 3 4 row_minimum column_index_of_minimum 
10 20 30 40 50 10    0 
9 8 7 6 5 5    4 

答えて

2

私は多くのものを使用したが、メインは、私は彼らがa

と関連していた回数に基づいてグループに bを分離させ ave(p1$a, p1$a, FUN = seq_along)ました
myans = setNames(data.frame(do.call(rbind, lapply(split(p1, ave(p1$a, p1$a, FUN = seq_along)), 
      function(x) x[,2]))), nm = rbind(p1$a[ave(p1$a, p1$a, FUN = seq_along) == 1])) 
minimum = apply(myans, 1, min) 
index = colnames(myans)[apply(myans, 1, which.min)] 
myans$min = minimum 
myans$index = index 
myans 
# 0 1 2 3 4 min index 
#1 10 20 30 40 50 10  0 
#2 9 8 7 6 5 5  4 
1

実行中のグループ数の後ろに集計および再構成を使用することを検討してください。

# RUNNING GROUP COUNT 
p1$grpcnt <- sapply(seq(nrow(p1)), function(i) sum(p1[1:i, c("a")]==p1$a[[i]])) 

# MINIMUM OF B BY GROUP COUNT MERGING TO RETRIEVE A VALUE 
aggdf <- setNames(merge(aggregate(b~grpcnt, p1, FUN=min),p1,by="b")[c("grpcnt.x","b","a")], 
        c("grpcnt", "row_minimum", "column_index_of_minimum")) 

# RESHAPE/TRANSPOSE LONG TO WIDE 
reshapedf <- setNames(reshape(p1, timevar=c("a"), idvar=c("grpcnt"), direction="wide"), 
         c("grpcnt", paste(unique(p1$a)))) 
# FINAL MERGE 
finaldf <- merge(reshapedf, aggdf, by="grpcnt")[-1] 
finaldf 

# 0 1 2 3 4 row_minimum column_index_of_minimum 
# 1 10 20 30 40 50   10      0 
# 2 9 8 7 6 5   5      4 
関連する問題