2017-12-14 4 views
-1

データセットでは、数値以外の値を扱うためのラベルエンコーディングが必要でした。しかし、列車と試験データには相互に関連しない値がいくつかあります。期待どおり、このエラーには「yに新しいラベルが含まれています:」と表示されます。この問題を解決し、エンコードをラベル付けするにはどうすればよいですか?列車と試験データのLabelEncoding個別に

+0

[最小限で完全で検証可能な例](https://stackoverflow.com/help/mcve) – Atsch

答えて

1

テストデータには、トレーニングデータに含まれていないラベルが含まれています。あなたのモデルがこれらの値にさらされていないので、これらは役に立たないので、それらから何も学んでいません。

  1. テストデータに存在しないpd.get_dummies、ドロップカラムを使用して1つのホットエンコードを作成する:

    は、これを解決する2つのアプローチがあります。

  2. 変数自体を削除します。

関連する問題