2016-07-04 7 views
0

2つの列を持つCSVファイルを入力するコードがあります。最初のものは、分単位で、およそ1ヶ月半(4/20/2016 2:39:00 PM - 5/29/2016 11:59:00 PM)で、2番目はmyです。各ポイントは0〜360の範囲です。私は36,044ポイントのデータを持っています。だから私は毎時平均を見つけることによってそれを整理しようとしています。私はまずdatetimeで整理し、次にそれを整理するためにパンダを使用することで考えましたが、それを動作させることはできません。私はPythonを使うのは比較的新しいです。Pythonを使用したCSVファイルの時間平均の検索

import csv 
import numpy as np 

#opening csv file 
f = open('Rmyoung_date_wind_dir.csv') 

#reading in all the data from the file row by row 
csv_f = csv.reader(f) 
for row in csv_f: 
    date=np.datetime64(row[0]) 

    direction=row[1] 

#adding 15 degrees to all directions 
    dircor=direction + 15 


#making sure that no numbers exceed 360  
    if dircor > 360: 
     dircor = dircor - 360 

#now finding hourly averages 
+0

たいまさに私が一時間がうまく行の特定の番号にマッピングされていないことを推測しているのですか?データの各点は、前の段階からの不規則なタイムステップである可能性がありますか? – dodell

答えて

1

パンダはあなたが

import pandas as pd 
data = pd.read_csv('Rmyoung_date_wind_dir.csv', index_col=0, squeeze=True, parse_dates=True, header=None) 
data.resample('H', how='mean') 
+0

'parse_date = True'がインデックスに適用されます。 '[0]'もうまくいくでしょう。 – mdurant

+0

ありがとうございます。私は印刷(データ)を試みましたが、それでも分単位でデータが送られてきました。私は間違って何をしていますか? – ClaudPuk

+0

申し訳ありませんが、「分単位のデータ」はどういう意味ですか? – mdurant

関連する問題