2012-05-08 15 views
2

私は6つの変数(6D空間Sを形成する)でそれぞれ記述された2つのタイプの人物、例えばMとFを持っています。私はMとFの密度が最大に異なるS内の領域を特定したいと思います。私は最初にF/Mを6つの変数にリンクするロジスティック二項モデルを試みましたが、このGLMモデルの結果は非常に解釈が難しい(部分的には数多くの重要な相互作用項に起因する)。したがって、私は「空間的」分析を考えています。ここでは、SとSのどこでもM個体とF個体の密度を別々に推定し、密度の差を計算します。最終的に私は手動で密度の最大の違いを探し、6つの変数で値を抽出します。多次元空間で密度を推定するR

パッケージsmの3次元空間の密度を推定する関数sm.densityが見つかりましたが、n> 3の空間では何も見つかりませんでした。あなたはRでこれをすることができる何かを知っていますか?あるいは、私の最初の質問(2番目の文)に答えるよりエレガントな方法がありますか? GLMモデルでこれを行うには、事前に

、あなたの助けを どうもありがとう

+0

多密度密度の視覚化に焦点を当てた 'denpro'パッケージは、それらを(明らかにグリッド上で)推定する関数も提供します。 –

答えて

2

能力は、すでに発生したinterpretablityの問題によってだけでなく、数値的安定性の問題の両方によって制約される可能性があります。さらに、GLMモデルについては説明していないので、非線形性の考慮を含めるかどうかはわかりません。多くのデータがある場合は、2D交差スプライン項を使用することを検討することができます。 (これらはない本当に密度の推定値である。)私はそれがどのように見えるかもしれない5次元でのrms/Hmiscパッケージの施設で最初の探査をしていた場合:VAR1の同時関数形を示すべき

library(rms) 
    dd <- datadist(dat) 
    options(datadist="dd") 

    big.mod <- lrm(MF ~ (rcs(var1, 3) + # `lrm` is logistic regression in rms 
         rcs(var2, 3) + 
         rcs(var3, 3) + 
         rcs(var4, 3) + 
         rcs(var5, 3))^2,# all 2way interactions 
        data=dat, 
        max.iter=50) # these fits may take longer times 
    bplot(Predict(bid.mod, var1,var2, n=10)) 

とvar2は、それぞれ10ポイントで3つの他の変数の中央値での「5次元」モデル推定値への寄与を示します。

3

関数1から6

pdfClusternpパッケージの範囲の寸法を有する多項データのカーネル密度推定を行うksパッケージのkdeはより高い次元でカーネル密度推定を実行する機能を提案します。

パラメトリック手法を使用する場合は、mclustまたはmixtoolsのようなガウス混合推定を行うRパッケージを見てください。