パンダでの補間関数の不確定性

私はpandasの補間関数を使って作業しています。ここでは説明のケースを作るためにおもちゃの例である：パンダでの補間関数の不確定性

df=pd.DataFrame({'Data':np.random.normal(size=200), 'Data2':np.random.normal(size=200)}) 

df.iloc[1, 0] = np.nan 

print df 

print df.interpolate('nearest')

私の質問：複数の列の上にinterpolate機能の仕事をしていますか？つまり、多変量解析を使用して不足しているフィールドの値を決定しますか？それとも単に個々の列を見ているだけですか？

出典

2016-03-30 Anonymous

個々の列を示します。 – Alexander

docs参照様々な利用可能な方法 - 最もわずかおそらくは単変量scipy.interp1dまたは他の単変量scipy方法を介して、indexに頼る：

方法：{「線形」、「時間」、「指標」 'slinear'、 'quadratic'、 'cubic'、 'barycentric'、 'krogh'、 'polynomial'、 'スプライン' 'piecewise_polynomial'、 'pchip'} '値'、 '最近傍'、 'ゼロ'

'linear'：インデックスを無視し、値を等間隔で扱います。これは、MultiIndexesでサポートされている唯一のメソッドです。
デフォルトの 'time'：補間は、指定された区間の長さを補間するための日々の高解像度データに作用します。 'index'、 'values'：インデックスの実際の数値を使用します。
' slinear '、' quadratic '、' cubic '、' barycentric '、' polynomial 'はscipy.interpolate.interp1dに渡されます。 '多項式'と 'スプライン'の両方で、順序（int）を指定する必要があります。 df.interpolate（メソッド= '多項式'、次数= 4）。これらはインデックスの実際の数値を使用します。
'krogh'、 'piecewise_polynomial'、 'spline'、および 'pchip'は、すべて同様の名前のscipy補間メソッドを囲むラッパーです。これらはインデックスの実際の数値を使用します。

Scipy docsとグラフ（軸= 1の場合又は行）出力をhere

出典

2016-03-31 00:02:27 Stefan

私はそれを見ました。しかし、私は彼らが多変量代用を使用しているのか、単に 'interp1d'を使用しているのかは分かりません。私はそれが多変量解析によってこれをすることを望んでいる。 –

scipyドキュメントを見ると、scipy関数は1次元の引数を取るので、指定された 'axis'キーワードに応じて単一の列または行の値を使います（' default = 0' 、個々の列を入力として使用する）。 – Stefan

パンダでの補間関数の不確定性

答えて

関連する問題