2016-03-30 24 views
1

私はpandasの補間関数を使って作業しています。ここでは説明のケースを作るためにおもちゃの例である:パンダでの補間関数の不確定性

df=pd.DataFrame({'Data':np.random.normal(size=200), 'Data2':np.random.normal(size=200)}) 

df.iloc[1, 0] = np.nan 

print df 

print df.interpolate('nearest') 

私の質問:複数の列の上にinterpolate機能の仕事をしていますか?つまり、多変量解析を使用して不足しているフィールドの値を決定しますか?それとも単に個々の列を見ているだけですか?

+0

個々の列を示します。 – Alexander

答えて

0

docs参照様々な利用可能な方法 - 最もわずかおそらくは単変量scipy.interp1dまたは他の単変量scipy方法を介して、indexに頼る:

方法:{「線形」、「時間」、「指標」 'slinear'、 'quadratic'、 'cubic'、 'barycentric'、 'krogh'、 'polynomial'、 'スプライン' 'piecewise_polynomial'、 'pchip'} '値'、 '最近傍'、 'ゼロ'

  • 'linear':インデックスを無視し、値を等間隔で扱います。これは、MultiIndexesでサポートされている唯一のメソッドです。
  • デフォルトの 'time':補間は、指定された区間の長さを補間するための日々の高解像度データに作用します。 'index'、 'values':インデックスの実際の数値を使用します。
  • ' slinear '、' quadratic '、' cubic '、' barycentric '、' polynomial 'はscipy.interpolate.interp1dに渡されます。 '多項式'と 'スプライン'の両方で、順序(int)を指定する必要があります。 df.interpolate(メソッド= '多項式'、次数= 4)。これらはインデックスの実際の数値を使用します。
  • 'krogh'、 'piecewise_polynomial'、 'spline'、および 'pchip'は、すべて同様の名前のscipy補間メソッドを囲むラッパーです。これらはインデックスの実際の数値を使用します。

Scipy docsとグラフ(軸= 1の場合又は行)出力をhere

+0

私はそれを見ました。しかし、私は彼らが多変量代用を使用しているのか、単に 'interp1d'を使用しているのかは分かりません。私はそれが多変量解析によってこれをすることを望んでいる。 –

+0

scipyドキュメントを見ると、scipy関数は1次元の引数を取るので、指定された 'axis'キーワードに応じて単一の列または行の値を使います(' default = 0' 、個々の列を入力として使用する)。 – Stefan

関連する問題