2
私はcsvのデータフレームに時系列データを含めたいと思います。私は、次の手順を使用します。パンダはどのようにしてインデックスを計算しますか?
path = [r'C:\data_' + str(x) + ".csv" for x in range(1150, 1177)]
data_df = pd.concat(pd.read_csv(f, delimiter = ",", header = None) for f in path)
data_df.head()
を、結果は以下のようなものです:
それはインデックス(1 187481まで)が異なっている可能性がありどのようにdata_df.info()
行数から(5387507)?
行う
data_df.reset_index()
ものは通常の取得:
それでは、どの最初のインデックスが計算されますか?
'pd.concat()'の呼び出しで 'ignore_index = true'をを使用してみてください。 'pd.read_csv()'を呼び出すたびに、各CSVファイルのインデックスが生成されます。それらを連結すると、デフォルトの 'pd.concat()'だけがコピーされますので、重複することになります... – MaxU
ありがとう@ヘルプのためのMaxU! – jcsun