7
データをフラットファイルに入力しました。私はこのデータをテーブルに分割して正規化したい。 pandas
でそれをきちんと行うことができます。つまり、フラット化されたデータをDataFrame
インスタンスに読み込んだ後、いくつかの関数を適用してDataFrame
インスタンスを取得することができますか?pandas:DataFrameを正規化する
例:
データはCSV形式でディスク上の私に与えられている。このようなファイル:
ItemId ItemDescription
1 scroll of Sneak
2 scroll of Invisibile
と
:私は2つのデータフレームを作成したいItemId ClientId PriceQuoted ItemDescription
1 1 10 scroll of Sneak
1 2 12 scroll of Sneak
1 3 13 scroll of Sneak
2 2 2500 scroll of Invisible
2 4 2200 scroll of Invisible
ItemId ClientId PriceQuoted
1 1 10
1 2 12
1 3 13
2 2 2500
2 4 2200
pandas
が最も簡単な場合にのみ良い解決策を持っている場合(上記の例のように多対1の関係を持つ2つのテーブルが正規化されます)、現在のニーズに十分対応できる場合があります。しかし、私は将来もっと一般的な解決法が必要かもしれません。