私は以下のようなインデックスとしてfloat値とtimestampの1つの列を持つデータフレームを持っています。索引内のすべてのタイムスタンプは昇順にソートされます。私は直線的に補間するにはどうすればよいパンダのデータフレームの2つの近傍(上および下または左および右)に基づくNaNの線形補間
timestamp value
2014-01-08 08:00:42 1
2014-01-08 08:01:00 NaN
2014-01-08 08:01:12 3
2014-01-08 08:01:52 7
2014-01-08 08:02:02 9
は/ 1と3の値(すなわち上方および下方値)に「のみ」に基づくNaN値を転嫁します。データフレームは膨大で、最大2 GBまで実行できます。あなたはデータフレームの値にそれらの比率を適用し、インデックス内のタイムスタンプの差に基づいて補間するあなたの質問を更新:だから速度は、この操作のために
おかげ
https://stackoverflow.com/questions/25234782/replace-nan-or-missing-values-with-rolling-mean-or-other-interpolation? – Zero
私はパンダdfのローリング機能について知らない。だから私はこのオプションで検索することができませんでした。このリンクをご指摘いただきありがとうございます。私の質問には非常に関連しています。ありがとう – RTM
私はタイムスタンプが等間隔でないことを質問に追加したいだけです。彼らは大きく異なっています。したがって、補間は、タイムスタンプとそれらがどれくらい離れているかにも基づいています。 – RTM