私は次のコードを使用してパンダに1つの新しいデータフレーム(DF3)に2つのデータフレーム(DFとDF2)をマージするpd.concatを使用しようとしています:パイソン/パンダのNaNデータの問題をマージ
DF3 = pd.concat([DF、DF2])
これはほとんど私はそれがしたいように動作しますが、それは問題を作成します。
dfには、現在の日付のデータが含まれており、インデックスは時系列です。それは次のようになります。
Facility Servers PUE
2016-10-31 00:00:00 6.0 5.0 1.2
2016-10-31 00:30:00 7.0 5.0 1.4
2016-10-31 01:00:00 6.0 5.0 1.2
2016-10-31 01:30:00 6.0 5.0 1.2
2016-10-31 02:00:00 6.0 5.0 1.2
DF2はNaNのデータが含まれており、インデックスが DF の1に形式的に対応する時系列ですが、以前の日付に開始し、通年の継続します(すなわち、365×48の30分間隔に対応する17520行)。それはこのように、基本的になります。
Facility Servers PUE
2016-10-01 00:00:00 NaN NaN NaN
2016-10-01 00:30:00 NaN NaN NaN
2016-10-01 01:00:00 NaN NaN NaN
2016-10-01 01:30:00 NaN NaN NaN
2016-10-01 02:00:00 NaN NaN NaN
2016-10-01 02:30:00 NaN NaN NaN
<continues to 17520 rows, i.e. one year of 30 minute time intervals>
Iが適用されます、私は以下の取得DF3 = pd.concat([DFを、DF2])
してから実行しますdf3.head()を:つまり
Facility Servers PUE
2016-10-31 00:00:00 6.0 5.0 1.2
2016-10-31 00:30:00 7.0 5.0 1.4
2016-10-31 01:00:00 6.0 5.0 1.2
2016-10-31 01:30:00 6.0 5.0 1.2
2016-10-31 02:00:00 6.0 5.0 1.2
2016-10-31 02:30:00 NaN NaN NaN
2016-10-31 03:00:00 NaN NaN NaN
2016-10-31 03:30:00 NaN NaN NaN
<continues to the end of the year>
は、コードがDFにデータの前に発生した時間間隔のためのNaNデータをすべて削除するようです。 df2にすべてのデータを保存する方法についてアドバイスします。dfの対応する時間間隔だけのデータで置き換えてください。
ありがとうございました。正確に私が必要としたもの。 – pottolom