この2つの相関を異ならせることは可能ですか?パンダスピアマン相関奇妙?
パンダバージョン0.18.1
from pandas import Series
a = ['Arsenal', 'Leicester', 'Man City', 'Tottenham', 'Crystal Palace']
b = ['Arsenal', 'Leicester', 'Man City', 'Tottenham', 'Man United']
c = ['Arsenal', 'Leicester', 'Man City', 'Tottenham', 'Man United']
d = ['Arsenal', 'Leicester', 'Man City', 'Tottenham', 'West Ham']
Series(a).corr(Series(b), method="spearman")
0.69999999999999996
Series(c).corr(Series(d), method="spearman")
0.8999999999999998
python 3.5.2とanaconda 4.4.1 –
pandasはこれらの文字列をどうにかしてアルファベット順にランク付けする必要があります。したがって、他のチームの存在に応じて、チームの順位を変えることができます。だからパンダは「正しく」計算していますが、これはあなたが望む操作ではありません。 –
私は統計学者ではありませんが、2つの数列で相関を計算する必要はありませんか?何を出力として期待していますか? Pandas 0.19.2では、文字列が浮動小数点型ではないため、上のサンプルコードがクラッシュします。 – nico