2016-03-25 13 views
-1

.csv/.txtの形式の大量のデータセットの表現には助けが必要です。データセットにはいくつかのカラムがありますが、一度に2つまたは3つを使用して表現したいと思います。このため私はPythonでパンダを使用しました。グラフィカル形式で表現したい特定の列を選択するにはどうすればよいですか?Pythonでpandasを使用して列名でCSVを読み取る方法は?

import matplotlib.pyplot as plt 
import pandas as pd 

data = pd.read_csv('/home/shristi/temp.csv', sep=',' , header=None ,index_col =0) 
data.plot(kind='bar') 
plt.ylabel('Core') 
plt.xlabel('Events') 
plt.title('Title') 
plt.show() 

方法:プロセス名、CPUコア、メモリのバイトは、プロセスなど

に割り当てられていると私は、バーグラフをプロットするために、次のコードを使用している -

私のデータベースには、列で構成されていこのcsvファイルを使用して割り当てられたプロセス名とプロセス名vs cpuコアとプロセス名のグラフをプロットしますか?

+0

特定のラベルの使用を選択するには

import pandas as pd column_list = ['a','b','c','d','e'] # populate this with your column names df = pd.read_csv('example.csv', header=True, names=column_list) 

探しているものでしょうか?既にデータをインポートしましたか?もしそうでなければ、[pandas.read_csv'の文書(http://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_csv.html)と特に 'usecols'引数を見てください。既にデータが読み込まれている場合は、[データの選択に関するドキュメント](http://pandas.pydata.org/pandas-docs/stable/indexing.html)を参照してください。 – Peter

+0

@peterデータは既に.csvファイルに読み込まれているため、後者を確認します。ありがとう – Shinigami2610

答えて

0

私はあなたの問題を正しく理解しています。これは、あなたがプロセスであるdf.loc[]

df.loc['a','b'] 
+0

あなたは正しい@sharadを得ましたが、私のコードで*** loc ***を使用したとき: 'column_list = ['イベント'、 '頻度'、 '余分'] data = pd.read_csv( ' /イベント/頻度/]// home/shristi/temp.csv '、sep ='、header =なし、index_col = 0) data.loc ['イベント'、 '頻度'] data.plot(kind = 'bar') plt (Key):エラー[KeyError:]ラベル[event]が見つかりませんでした。 [索引] ''。 _events_はプロセスの名前(文字列データ型)で構成されているのに対し、*** loc ***は数値に使用されていると思います。私は正しい? – Shinigami2610

+0

'read_csv'に引数として' names = column_list'を渡していません。 – Sharad

+0

私はやった...私の悪い...私はここでそれを逃した..私はそれを言及している。 'data = pd.read_csv( '/ home/shristi/temp.csv'、sep = '、'、header = None、index_col = 0、names = column_list)' – Shinigami2610

関連する問題