申し訳ありませんが、私は機械学習を始めました。だから、この質問は私が避けることができないことを恐れている無知に聞こえるでしょう。また、私は自分の能力を最大限に捜して、私の質問に答えるかもしれない同様の質問や答えを見つけることができませんでした。データセットは、すべてのパラメータに対して正規分布にする必要がありますか?
モデルが正規分布を持つデータセットではないかどうかを学習できないことを知りました。また、データセットが正常に分散されているかどうかを調べるために使用する唯一の方法は、各パラメータについてhereと記載されているグラフィカルメソッドです。それはお勧めできないかもしれません、もしそうなら私はいつも変更の対象ですので、そうであれば私を修正してください。
私の質問には、特定のパラメータの正規分布が表示される場合は、 まだいくつかの他の人は、データセットに欠陥があるという意味ですか?それとも、モデルにこれらのパラメータを使用すべきでないということですか?
ご迷惑をおかけして申し訳ありませんが、私の概念の理解に根本的な誤りがある場合。
「モデルが正規分布を持つデータセットではないかどうかをモデルが知ることができないことを知りました。」 - >はモデルによって異なります。'いくつかのパラメータに対して正規分布を見ても、他のいくつかのパラメータではない場合、データセットに欠陥があるのですか?' - >いいえ、その特定のモデルがあなたのデータに適していないことを意味します。あなたは別のものを見つけなければならないかもしれません。 – cel
ありがとう、私はモデル選択のコンセプトがあなたのおかげで少しうまくいったことを理解したと思う。 –
+ cel AdaBoost Regressorがこの質問に記載されている種類の配布に有効かどうか質問できますか?また、何もない場合、それはいいですが、そのような場合に使用できるモデルのリストがありますか?上記の状況に対してモデルが有効であるかどうか判読するための経験則か? –