パンダのデータフレームのインデックスをリセットするにはどうすればいいですか？

143

私はいくつかの行を削除するデータフレームを持っています。結果として、私はインデックスが何かのようなデータフレームを得ます：[1,5,6,10,11]と私は[0,1,2,3,4]にそれをリセットしたいと思います。どうしたらいいですか？パンダのデータフレームのインデックスをリセットするにはどうすればいいですか？

df = df.reset_index() 
del df['index']

次は動作しません：

df = df.reindex()

出典

2013-12-10 Roman

318

reset_index()は、あなたが探しているものである

が動作しているようです以下

を追加しました。あなたはそれが列として保存されたくない場合は、操作を行います。

df = df.reset_index(drop=True)

出典

2013-12-10 10:19:52 mkln

+47

+1 'drop = True' – Rhubarb

+53

データフレームを同じ変数に再割り当てするのではなく、' inplace = True'引数を設定することができます。 – ahuelamo

'inplace = True'の場合、メソッドはNoneを返します。 – alyaxey

別の解決策が割り当てRangeIndexまたはrangeです：

df.index = pd.RangeIndex(len(df.index)) 

df.index = range(len(df.index))

それは速いです：用

df = pd.DataFrame({'a':[8,7], 'c':[2,4]}, index=[7,8]) 
df = pd.concat([df]*10000) 
print (df.head()) 

In [298]: %timeit df1 = df.reset_index(drop=True) 
The slowest run took 7.26 times longer than the fastest. This could mean that an intermediate result is being cached. 
10000 loops, best of 3: 105 µs per loop 

In [299]: %timeit df.index = pd.RangeIndex(len(df.index)) 
The slowest run took 15.05 times longer than the fastest. This could mean that an intermediate result is being cached. 
100000 loops, best of 3: 7.84 µs per loop 

In [300]: %timeit df.index = range(len(df.index)) 
The slowest run took 7.10 times longer than the fastest. This could mean that an intermediate result is being cached. 
100000 loops, best of 3: 14.2 µs per loop

出典

2017-08-15 11:40:58 jezrael

@Outcast Source - 最速は' len（df.index） '、381nsと' df.shape' 1.17usです。何か不足している？ – jezrael

パンダのデータフレームのインデックスをリセットするにはどうすればいいですか？

答えて

関連する問題