3
2つのカテゴリ変数間の頻度の平均と中央値を取得する必要があります。例:2つのカテゴリ変数(パンダ)の説明統計
ラベル文字番号
Foo | | 1
Foo | B | 2
Foo | C | 4
バー| | 2
バー| G | 3
バー| N | 1
バー| P | 2
Cee | B | 1
Cee | B | 2
Cee | C | 4
Cee | D | 5
たとえば、ラベルあたりの平均文字数と中央値は何ですか?ここでは、3つの可能なラベルのうち11のケース(M = 3.667)があり、中央値は4(3つのfoo、4つのバー、4つの4ee)である。どのように私はパンダでこれを計算できますか? groupbyステートメントでこれを行うことは可能ですか?私のデータセットはこれよりはるかに大きいです。
は私がオフトピック質問があります。 OPのデータをデータフレームにどのようにインポートしますか? – bhansa
'sep =" \ s + \ | \ s + "'を使用し、手動で 'header'sに' | 'を手動で追加します – jezrael
' sep = "\ s + \ | \ s + | \ s +" ' | 'ヘッダーへ – jezrael