glm

0熱

1答えて

私は、次元削減のために後方選択と線形回帰を比較しようとしています。データセットはむしろ150変数で大きくなります。私はいつもこの時間はこのデータセットで選択したモデルのためのクロスバリデーションとの比較を生成するために、同じ方法を使用しますが、している、cv.glmは私が解決する問題があるエラーを与える：モデルでエラー.frame.default（式= SurveyTest $ H.test〜

1熱

1答えて

train（method = "glm"、...）とglm（...）は同じ回答を期待していますか？

私はtrainSAとtestSAという名前のデータセットを使用しています。とりわけ、列番号はchd age alcohol obesity tobacco typea ldlです。このコマンドは（私はRで働いていることに注意してください） set.seed(13234) modFit<-train(chd~ age+ alcohol+ obesity +tobacco +typea +ldl,

2熱

1答えて

Rでsample.splitを使用してデータが正しく分割されず、ロジスティック回帰で発行される

2つの問題があります。私は以下のようにsample.splitを使用して、テストや電車のセットに私のデータを分割しようとすると、サンプリングはかなり不鮮明に行われます。私が意味するのは、データdの長さが392であるため、4：1除算では0.8 * 392 = 313.6つまり313または314行がテストセットに表示されますが、示されている長さは304です。行方不明ですか？ require(caTo

1熱

1答えて

glmがエラーを返します。何が間違っていますか？

私はデータセット（data_2、以下を参照）でRでglm（）コマンドを使用しようとしています。私は、次のコマンドを使用します。 glm(formula = GRM_KerkMeerlo ~ ((fGS*0.865 + fQS*EC_QS + fXS*EC_fXS)/Q), data = data_2) 私は正しいことをやっていたと思ったが、私は、この入力を実行すると、私はエラーを取得：私はこの

1熱

1答えて

GLM回帰予測 - どの因子レベルが成功かを理解する

私は二項glmモデルを構築しました。このモデルは、2つの潜在的なクラス（ADまたはControl）の間の出力を予測します。これらの変数は、{AD、Control}レベルの要因です。私はこのモデルを使って各サンプルの確率を予測していますが、0.5を超える確率がADまたはコントロールを示すかどうかは私には不明です。ここでは私のデータセットです。 > head(example) clea

0熱

2答えて

`Summary`複数のLMオブジェクトとGLMオブジェクト

私はRに50 lmとglmオブジェクトを持っています。summary(lm...)を50回タイプすることなく、それらのすべての要約を得たいと思います。それをすばやく行う方法はありますか？データセットの名前は、lin.mod.t＃またはlin.mod.s＃（{＃= 1,2、...、25}）のように始まります。私は ls(pattern = "lin.mod") objects(pattern =

2熱

1答えて

Matlab - カテゴリワイズのステップワイズGLM

私は85個の予測変数のテーブルを用意しています。そのうちのいくつかは数値、論理、序数、名義（ホット1符号化）です。彼らは、私が使用して段階的にGLMを実行している0から1の範囲にある単一finalScoreアウトカムVARを予測している。 % model2 = stepwiseglm(predictors, finalScore); 各予測のヘッダは、それがある4つの種類のいずれかを示し、場合、私

1熱

1答えて

ロジスティック回帰を実行するのが困難です。

glmを使用してRでロジスティック回帰を実行する際にいくつかの問題があります。バイナリ応答変数をglmに渡してロジスティック回帰を実行するには、2つの方法があります。データをシリアルデータ形式でglmに渡すことができます（例：観測ごとに1行、応答変数は0または1、独立変数にはあなたが持っている値を持ちます）、またはそれを渡すことができます最初の列は試行回数を示し、2番目の列は成功数を示し、3番目の

1熱

1答えて

h2oでアンサンブル - モデルが見つからない

h2oパッケージを使用して、異なる正規化パラメータ（アルファ、ラムダ）を持つGLMモデルからアンサンブルを構築しています。 [email protected]_idsはGLMに最適な alphaと lambda正則化パラメータを決定するために、グリッドサーチからモデルです ensemble <- h2o.stackedEnsemble(x = predictors, y =

0熱

1答えて

GLM要約の解釈を確認するR

私がやっていることがすべて正しいことを確認したいだけです！私はいくつかのサイトで鳥の数を農地と湿地の2つの生息地に分類しています。私は単にどの生息地がより多くの個体数を持っているかを知りたいだけです。私は（彼らは、カウントデータであるとして）ポアソン機能でGLMを使用しています： > mod <- glm(count ~ habitat, family = "poisson") > sum