私はxとyのデータセットを持っています。各データセットについて、点(x、y)をRにプロットします。そして得られたプロットは、一般にtype Aまたはtype Bのいずれかに似ています。タイプBには交差点があり、タイプAには交差点がありません。元のデータセットとのカーブ(交差が発生する可能性があります)の下の面積を計算するにはどうすればよいですか?
私の質問:新しいデータセットを考えると、それは視覚化を知らずにタイプAとタイプBのプロットに示されるように、曲線の下の赤斜線(Rで)を算出することができますか?
主な課題は、次のとおり
1)データセットがRでタイプA又はタイプBを生成するかどうかを決定する方法は?
2)Rタイプのデータセットを使用してタイプBの赤い陰影付き領域を計算するにはどうすればよいですか?
ここでは、タイプBカーブを生成したデータセットを生成するコードを示します。ここ
set.seed(300)
predicted_value_A = c(rbeta(300, 9, 2), rbeta(700, 2, 4), rbeta(10000, 2, 4))
predicted_value_B = c(rbeta(1000, 4, 3), rbeta(10000, 2, 3))
real_value = c(rep(1, 1000), rep(0, 10000))
library(ROCR)
library(ggplot2)
predB <- prediction(predicted_value_B, real_value)
perfB <- performance(predB, measure = "mat", x.measure = "f")
yB <- attr(perfB, "y.values")[[1]]
yB <- (yB + 1)/2
xB <- attr(perfB, "x.values")[[1]]
# dataset that generates type B curve
dfB <- data.frame(X = xB, Y= yB)
ggplot(df, aes(x=X, y=Y, ymin=0, ymax=1, xmin=0, xmax=1)) + geom_point(size = 0.2, shape = 21, fill="white")+
ggtitle("Type B curve") +
theme(plot.title=element_text(hjust=0.5))
これはRの質問であるかわかりません。サンプルデータやRコードの試行は見られません。 –
タイプBカーブを生成するRコードを追加しました! – Kirin