カテゴリデータの3つの列をバイナリカテゴリ名の列の単一のセットに結合する必要があります。これは "ワンホット"に似ていますが、ソース行には1つではなく3つのカテゴリがあります。また、100以上のカテゴリがあり、私はそれらをあらかじめ知っていないことに注意してください。Python/Pandasで「たくさんのホット」を構築するには?
id, fruit1, fruit2, fruit3
1, apple, orange,
2, orange, ,
3, banana, apple,
生成する必要があります...
id, apple, banana, orange
1, 1, 0, 1
2, 0, 0, 1
3, 1, 1, 0
あなたが各行に値のカウントを適用することができます