私がやっているいくつかのWebスクレイピングと私はの形で関心の変数を格納しています:の変換リストDictのデータフレームへの:パンダ
a = {'b':[100, 200],'c':[300, 400]}
これがあった1ページのための2つb
" 2つのc
のです。私はdict
年代のリストからDataFrame
を作成するために行くとき、私が取得
b = {'b':[300, 400, 500],'c':[500, 600, 700]}
:
import pandas as pd
df = pd.DataFrame([a, b])
df
b c
0 [100, 200] [300, 400]
1 [300, 400, 500] [500, 600, 700]
何次のページでは、と私はそれらを保存したい各の3を持っている可能性があり私は期待しています:
df
b c
0 100 300
1 200 400
2 300 500
3 400 600
4 500 700
私はDataFrame
「SAのリストをページを保存し、concat
DataFrame
たびに作成することができます終わり。しかし、経験に基づいて、これは非常に高価です。何故ならば、DataFrame
の建設は、下位レベルのコンストラクタ(すなわちdict
のリスト)からDataFrame
を作成するよりもはるかに高価なためです。
[この質問の可能な重複](http://stackoverflow.com/q/38577737/6525140)?正確ではありませんが、少なくとも両方の質問はお互いに強く関係しています。 – mhoff
キーを反復し、リストをマージすることは、あなたが望むソリューションのようです。 –
他に何かのために 'a'と' b'のディクテーションが必要ですか?そうでない場合は、すべてのページからデータを受け取ったときにデータを追加するだけで、 'df = pd.DataFrame(a)'を実行することができます。 –