私はser_no
とCTRY_NM
が同じで異なっていると判断したいデータフレームを持っています。しかし、私はser_no
の変更を心に留めて、偽と偽の戻り値をtrueにしたり、false/trueの戻り値をfalseにしたりしないようにします。Python:pandaのデータフレームの列との論理比較
は、次のデータフレームを考えてみましょう:
import pandas as pd
df = pd.DataFrame({'ser_no': [1, 1, 1, 2, 2, 2, 2, 3, 3, 3],
'CTRY_NM': ['a', 'a', 'b', 'e', 'e', 'a', 'b', 'b', 'b', 'd']})
def check(key):
return df[key] == df[key].shift(1)
match = check('ser_no') == check('CTRY_NM')
これが返されます。
をしかし、指標で、4と8我々は、シリアル番号の変更を持っています。各シリアル番号は異なるマシンであるため、これらの場所で論理比較を行うことは意味がありません。 ser_no
が変更された場合、どうすれば論理比較を行う代わりにNaN
を挿入できますか?
あなたはおそらく最初)(GROUPBY使用します。 –
@CorleyBrigmanあなたはgroupbyがどのように役立つかを詳しく説明できますか? – dustin