2017-01-24 8 views
0

こんにちは私は複数の列を反復処理しています。しかし、すべてのCSVファイルの列名は、そのような順序である:複数の列を反復した後に列を順番に取得する

Output: id title content tags 

私のコードは、この順序で列を出力ただし:

Output : content id tags title 

私はそれを取り戻すにはどうすればよいために、すべてのことCSVファイルはここに

としてそれを持っている以下の私のコードです:

import glob 
import os 
import pandas as pd 
pd.set_option("display.max_rows", 999) 
pd.set_option('max_colwidth',100) 
import numpy as np 
from IPython.display import display 
%matplotlib inline 

file_path = 'data/'      
all_files = glob.glob(os.path.join(file_path, "*.csv"))  

merging_csv_files = (pd.read_csv(f) for f in all_files) 
stack_exchange_data = pd.concat(merging_csv_files, ignore_index=True) 

print ("Data loaded succesfully!") 
print ("Stack Exchane Data has {} rows with {} columns each.".format(*stack_exchange_data.shape)) 

答えて

1

選択するための一般的な方法特定の順序で列を持つデータフレームは、単にあなたが望むし、このようなデータフレームのブラケットオペレータにそのリストを渡すためのリストを作成することです:

my_col_order = ['id', 'title', 'content', 'tags'] 

df[my_col_order] 

また、あなたはすべてのことをチェックしたい場合がありますDataFramesは実際に同じ列順序を持ちます。私はパンダがconcatの列名を並べ替えるのは、少なくとも1つのDataFrameに異なる列の順序がない限り、並べ替えるとは思いません。連結しているすべてのDataFramesのすべての列名を印刷することができます。

+0

すごく簡単!魅力的に働いた!ありがとう@テッドペトロ –

関連する問題