複数のCSVファイルを分析する

-3

私は10個のCSVファイルにデータを持っています。各csvファイルには1行のデータエンティティ（500000データポイント、ヘッダーなしなど）があります。 3つの質問：複数のCSVファイルを分析する

データを500000行の1列に変換するにはどうすればよいですか？
これらを1つの配列にインポートする方がいいですか？500000 x 10を分析してください。もしそうなら、どうすればこのことができますか？
また、1つのDataFrame 500000 x 10にインポートして解析する方がよいでしょうか。

2016-07-18 deserthiker

ファイル名のリストがfilesであるとします。その後：

df = pd.concat([pd.read_csv(f, header=None) for f in files], ignore_index=True)

df

は、10×500000データフレームです。それを500000 x 10にするdf.T

答えは2と3です。

出典

2016-07-18 21:42:34 piRSquared

@deserthiker：df.as_matrix（）を使用してnumpyに変換することもできます。 – Ohumeronen

まず、すべての10のCSV読み：

import os, csv, numpy 
import pandas as pd 

my_csvs = os.listdir('path to folder with 10 csvs') #selects all files in folder 
list_of_columns = [] 
os.chdir('path to folder with 10 csvs') 

for file in my_csvs: 
    column = [] 
    with open(file, 'r') as f: 
     reader = csv.reader(f) 
     for row in reader: 
      column.append(row) 
    list_of_columns.append(column)

をこれは、あなたがリスト-列のリストを取得する方法です。次に、それらをpandas dfまたはnumpyに変換します。

出典

2016-07-18 21:58:21

複数のCSVファイルを分析する

答えて

関連する問題