pandas DataFrameを参照渡し

私の質問は、参照渡し時のpandas DataFrameの不変性に関するものです。 fooがpandas DataFrameを参照渡し

def foo(df1, df2): 

    df1 = df1.join(df2['C'], how='inner') 
    df1['B'] = 1 

    return()

（すなわち "として定義されている場合、出力は、

はなく実際に

ある

import pandas as pd 

def foo(df1, df2): 

    df1['B'] = 1 
    df1 = df1.join(df2['C'], how='inner') 

    return() 

def main(argv = None): 

    # Create DataFrames. 
    df1 = pd.DataFrame(range(0,10,2), columns=['A']) 
    df2 = pd.DataFrame(range(1,11,2), columns=['C']) 

    foo(df1, df2) # Pass df1 and df2 by reference. 

    print df1 

    return(0) 

if __name__ == '__main__': 
    status = main() 
    sys.exit(status)

：次のコードを考えてみましょう他のステートメントの前に「join」ステートメント）出力は単純です

私はなぜこのような場合に興味がありますか？どんな洞察にも感謝します。

出典

2016-09-30 labrynth

を書くことができところで、復帰は関数ではありません、それだけの文だので、あなたはそれの後の括弧は必要ありません。 – Jezzamon

[This]（http://nedbatchelder.com/text/names.html）は、私が知っているPythonの名前がどのように動作するかについての最良の議論です。理解すれば、この行動を理解するでしょう。 – chthonicdaemon

ありがとう@chthonicdaemon！ – labrynth

問題は、この行は次のとおりです。

df1 = df1.join(df2['C'], how='inner')

df1.join(df2['C'], how='inner')は、新たなデータフレームを返します。この行の後には、df1は引数と同じデータフレームを参照するのではなく、新しい結果に再割り当てされているため新しいものを参照します。最初のデータフレームは、変更されずにそのまま存在します。これは実際にはパンダの問題ではなく、一般的な方法であるPythonやその他のほとんどの言語で動作します。

いくつかのパンダ関数にはinplaceという引数がありますが、これはあなたが望むことをするでしょうが、結合操作は行いません。データフレームを変更する必要がある場合は、代わりにこの新しいフレームワークを返し、関数の外に再割り当てする必要があります。

出典

2016-09-30 04:20:10 Jezzamon

ありがとう@Jezzamon。それは理にかなっている。 – labrynth

Pythonには値渡しと比較渡しがありません。ちょうどbindings from names to objectsです。

あなたが、その後

def foo(df1, df2): 

    res = df1.join(df2['C'], how='inner') 
    res['B'] = 1 

    return res

df1にdf2をあなたの機能を変更する場合は、関数の中で、あなたが送信されたオブジェクトにバインドされています。この場合の新しいオブジェクトであるjoinの結果は、resという名前にバインドされています。他のオブジェクトやバインディングに影響を与えることなく、操作して戻すことができます。あなたの呼び出し元のコードで

、あなただけの

print foo(df1, df2)

出典

2016-09-30 04:40:36

pandas DataFrameを参照渡し

答えて

関連する問題