pandas

    1

    1答えて

    名前が列レベルにアタッチされたマルチインデックスデータフレームがあります。 (DF1)私は、彼らが参照データフレーム(DF2)の行のインデックスで指定された順序と一致するように周りに列をシャッフルしたい TIME TMC 111N1 111P2 111N3 111P4 DATE EPOCH 0 143 113 103 NaN

    1

    2答えて

    私はこのようになりますパンダDATAFRAME dfがあります、私は唯一の'a'がBにリストに属するそれらの行を選択することでdfをサブセットしたい今 A B 0 ['a','b'] 1 ['c','d'] 2 ['a','c'] 3 ['b','d'] 4 ['a','d'] を、所望の出力ビーイング: A B 0 ['a','b'] 2 ['a','c'] 4 ['a'

    1

    2答えて

    私は自分のプログラムでこの関数を使用していますが、より良い性能を研究しているものはベクトル化によって実現できます。 以下のコードを使用するのではなく、ベクトル化された関数を使用して同じ解像度を達成するにはどうすればよいですか? for i, row in df.iterrows(): ifor_val = something if <condition>: ifor

    -1

    1答えて

    これは、前の質問からフォローです:私はによってグループ化されたパンダのデータフレームの結果から、降順で棒グラフを作成しようとしているPlot number of occurrences from Pandas DataFrame "発行オフィス"。データは、System(ストリング)、発行オフィス(ストリング)、エラータイプ(ストリング)の3つの列を持つcsvファイルから得られます。最初の4つのコ

    1

    1答えて

    私は2つのデータフレームを持ち、どちらも重複を持つ可能性のあるキー列を持っていますが、データフレームの重複キーは大部分です。私はこれらのデータフレームをそのキーにマージしたいのですが、両方が同じ複製を持つ場合、それらの複製はそれぞれマージされます。さらに、あるデータフレームに他のキーと重複するキーがある場合は、その値をNaNとして埋めたいと思います。たとえば: df1 = pd.DataFrame

    2

    1答えて

    私は〜250,000行と〜50個の列を持つDataFrame dfを持っています。これらは(簡体字)のような はコラムでは、重複値がある:私がやりたい何 'A' 'B' jean 626 michel 950 john 382 john 356 <-- duplicate value boris 315 clara 886 george 619 edmund 365 edmu

    1

    1答えて

    私はパンダシリーズを持ち、隣人である要素の間の手段を計算したい。たとえば[1 2 3 4 5 6 7 8 9]については は[1.5 2.5 3.5 4.5 5.5 6.5 7.5 8.5]

    0

    1答えて

    私はpandas.read_csvを使用してcsvファイルを読んでいます。必須列が空であるかどうかを検出するにはどうすればよいですか?

    2

    2答えて

    私はhttps://github.com/brandon-rhodes/pycon-pandas-tutorial/blob/master/Exercises-3.ipynbのパンダチュートリアルに取り組んでいます。それはcastデータフレームの演習があり、サンプルは、その一つの小さな違いを除いてほぼ同様です2つのコマンドがあります あり、もう一方は、他方の出力データフレームシリーズを出力します。

    1

    1答えて

    1234567.89のような値を持つ列を1,234,567.89に変換したいとします。誰かがこれで私を助けることができますか? df['new_column_name'] = df['column_name'].map('{:,.2f}'.format) をしかし、新しい列が文字列ではなく、山車が含まれていることに注意してください: