私は2つのインデックスを持つパンダのデータフレームを持っています。 (MultiIndex)df.as_matrix(...)
のようなヌンキー行列を出したいのですが、この行列の形状は(n_rows, 1)
です。私は形の行列(n_index1_rows, n_index2_rows, 1)
が欲しいです。マルチインデックスからヌンディマトリックスへのパンダのデータフレーム
.groupby(...)
を使用する方法はありますか.values.tolist()
または.as_matrix(...)
希望する形状を得るには?
EDIT:データ
value
current_date temp_date
1970-01-01 00:00:01.446237485 1970-01-01 00:00:01.446237489 30.497100
1970-01-01 00:00:01.446237494 9.584300
1970-01-01 00:00:01.446237455 10.134200
1970-01-01 00:00:01.446237494 7.803683
1970-01-01 00:00:01.446237400 10.678700
1970-01-01 00:00:01.446237373 9.700000
1970-01-01 00:00:01.446237180 15.000000
1970-01-01 00:00:01.446236961 12.928866
1970-01-01 00:00:01.446237032 10.458800
これはアイデアの一種である:
np.array([np.resize(x.as_matrix(["value"]).copy(), (500, 1)) for (i, x) in df.reset_index("current_date").groupby("current_date")])
3D配列が必要ですか?または、インデックスだけでなく列を含む単なる2D配列ですか? –
3Dアレイ。 np.arrayのすべての値は、カラム値(インデックスではありません)である必要があります –
希望の出力でサンプルデータを提供してください。 – Alexander