インデックスが一意であることを強制する機能はありますか?それとも、それはdictやbackなどに変換することによって、これをPython自体で処理するだけでしょうか?python pandasは連続して重複を削除します
以下のコメントに記載されているように、python pandasはnumpy/scipy上に構築されたプロジェクトです。
to_dictとback worksですが、BIGになるとこれは遅くなると思います。
In [24]: a = pandas.Series([1,2,3], index=[1,1,2])
In [25]: a
Out[25]:
1 1
1 2
2 3
In [26]: a = a.to_dict()
In [27]: a
Out[27]: {1: 2, 2: 3}
In [28]: a = pandas.Series(a)
In [29]: a
Out[29]:
1 2
2 3
pandas 0.8以降では、重複するインデックス、つまりs = Series([1,2,1]、index = ['a'、 'a'、 'b'])を持つことができると思います。 to_dictとbackはそのトリックを行いますが、これを処理するオプションや何かがあるかのように思われます。あるいは、私がSeriesを構築している方法と関係があるかもしれません。 – mathtick
は質問をクリアするためのものです。それは時間のカップルでウェスマッキニーを見逃したうんざりです... – root
@ mathtick - 答えを編集しました。 – root