DataFrame(DF)、B
を2つの異なる(行単位で)サブセットに分割しようとしています。私は最初にsample
DFを含む新しいDFを生成する。行の半分はB
です。その後、私はこの新しいDF、b2
はz
値はb1
に含ま等しくないにあるB
z
と値のすべての行が含まれていることを条件とDFにfilter
にしてみてください。SparkR操作で2つの別々のDataFrameを参照する
これはかなり簡単なようです。ただし、filter
式は空のDataFrameになります。 filter
の構文を誤解していますか、または単にSparkR操作の個別のDataFramesを参照できませんか?
w <- rbind(3, 0, 2, 3, NA, 1)
z <- rbind("a", "b", "c", "d", "e", "f")
d2 <- cbind.data.frame(w, z)
B <- as.DataFrame(sqlContext, d2)
b1 <- sample(B, FALSE, 0.5)
b2 <- filter(B, B$z != b1$z)
これは素晴らしいことでした。ありがとう。 – kathystehl