現在、私はタイタニックのデータセットに取り組んでいます。それは4-5の非数値列で構成されています。 sklearn.LabelEncoderクラスを適用して、これらの非数値列のエンコードされた値を取得します。私は間違いなく、このメソッドを1つずつ各列に適用できます。しかし、このようなコラムが20-30本以上あると、仕事は面倒になるでしょう。私はそのような非数値列の名前を知っているので、簡単な方法でこれを行うための洗練された方法はありますか?パンダの複数の列にラベルをエンコードする
答えて
ちょうど
obj_cols = df.select_dtypes(include=[object])
for i in obj_cols:
df[i+'label'] = le.fit_transform(df[i])
単一のlabelencoderオブジェクトの使用' le'は列車とテストデータ。 –
ラベルエンコーディングを実行する前に列車データとテストデータを組み合わせることを常にお勧めします。ラベル・エンコーダを別々に実行すると、常にテスト・データに新しいカテゴリがある可能性があります –
"test"のポイントは新しいものをシミュレートするため、何かのために "train and test data ... before"あなたがプロダクションで取得したデータであり、そのようなデータがどのようなものになるかは事前に分かりません –
- 1. 複数の列のパンダget_level_values
- 2. 複数の列を再サンプルするパンダ
- 3. パンダ、DataFrame:1つの列を複数の列に分割する
- 4. パンダ複数の列に同じ名前
- 5. パンダ複数列Groupbyプロット
- 6. 複数の列を持つパンダ・フィルナ
- 7. パンダの複数列のランク付け
- 8. 複数の列をパンダの別の列で割る
- 9. 列ラベルに基づいてパンダのデータフレームを整形する
- 10. パンダ集計関数で複数の列を作成する
- 11. パンダの複数列因子分解
- 12. 複数の列でグループとパンダ
- 13. パンダ3x3のスキャッタ行列欠落ラベル
- 14. パンダの行のサブセットの複数の列を変更するDataFrame
- 15. パンダpython2.7で複数の他の列のエントリに列エントリ
- 16. パンダ:文字列に対する複数の条件
- 17. 複数列形式のラベルの高さ
- 18. 2列の値 - > 1列の値+ 1列のラベルのパンダ
- 19. パンダ複数の列を配列に結合してValueErrorにする
- 20. 複数のラベル
- 21. パンダ - インデックスを含む複数の列をマージする方法
- 22. パンダ:1列に合計まで複数の列
- 23. パンダの複数のデータフレームの一致する列
- 24. 同じ値の複数列を集約するパンダ
- 25. パンダのデータフレームを文字列ラベルでプロットする
- 26. Javaの複数ラベルにラベルを追加する
- 27. 複数のファイルを1つの変数にエンコードする
- 28. パンダは複数の列のインデックス順を並べ替えます
- 29. 複数のパンダのデータフレームに表示される名前で列をドロップする
- 30. 複数のラベル... iphone
が希望でしたオブジェクトの種類を選択した後にループを実行 'fillna' https://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.fillna.html –
いいえ!私はsklearn.LabelEncoderという用語自体を質問しました – HrishikeshKulkarni
名前とラベルエンコーダーでforループを使用するのはなぜですか? –