2016-07-19 8 views
0

Pythonでpandasライブラリを使用して、マルチインデックスデータを生成しています。つまり、そのカラムはマルチインデックス化されています。インデックスはcategorysourceです。私は.csvファイルとしてこのデータを保存します。ファイルでは、最初の行はcategoryの値であり、2番目の行はsourceの値に対応しています。このファイルを使ってOrange3ソフトウェアで視覚化します。しかし、最初の行だけが列名として使用されますが、2つの組み合わせとして列名を取得するにはどうすればよいですか。複数のインデックス付きデータをオレンジ色で視覚化するにはどうすればよいですか?

可能であれば、すべてをヒストグラムとして視覚化しようとしています。

  1. 、効果的に2(category及びsource)+ 1(行ラベル)変数があるので、3Dビジュアライゼーションは、最良又は
  2. 1(categorysource合わせ可変)+ 1(行であろうラベル)、2Dの可視化

category 1 1 1 1 1 2 2 source a b c d e f g label l1 1 2 3 4 5 6 7 l2 4 5 6 7 8 9 10

+0

は、あなたが提供することができ、最初の数(4 -5)行をcsvファイルの構造を明確にする? – astaric

+0

サンプルを編集するために質問を編集しました@astaric –

答えて

0

documentationによると、オレンジのありませんマルチインデックスデータを読むことができます。

データを視覚化するには、データをcsvにエクスポートする前に、通常の表形式(機能ごとに1つの列)に変換する必要があります。

df.unstack().to_csv("file.csv") 

これは、次の形式でファイルを生成します:

category source label 
1   a   l1  1 
1   a   l2  4 
1   b   l1  2 
... 

この方法で、あなたは、カテゴリとソースを使用することができ、それを行うには

一つの方法は、DataFrameunstack方法であり、オレンジ色で別々の変数として。

df.columns = [' '.join(col).strip() for col in df.columns.values] 
df.to_csv(file.csv) 

これは、次の形式でデータを作成します:

カテゴリとソースに参加するには、あなたはcsvファイルにエクスポートする前にflatten the hierarchical indexに必要

label  1 a  1 b ... 
l1   1   2 
l2   4   5 
関連する問題