2017-07-17 3 views
0

Okだから、私はpd.groupbyデータフレームでtxtを書いた。今私はそれを開く必要があります。パンダgroupbyからtxtを複数の列に読み込む

f = open('C:/MDH.txt', 'r') 
reg = f.read() 
rege = np.asarray(reg) 

それはちょうど私の長い\とラインnは、行は元の配列に終わったが得られますが、422472個の要素のための無区切りと:私は今のところ得たもの

です。一例として、部分:

array('4.498000000000000000e+03 5.866666666666667140e+00 1.989999999999999858e+01 6.763333333333333997e+01 3.600000000000000000e+01 0.000000000000000000e+00 -7.165617522142724738e+00 2.800000000000000000e+01 4.000000000000000000e+00 3.000000000000000000e+00 0.000000000000000000e+00 0.000000000000000000e+00\n4.495000000000000000e+03 5.799999999999999822e+00 

私がTXTで422472の要素に対して、35.206行で12列の配列にこれを回収することで必要なもの。

また、私はPythonで1.989999999999999858e + 01から19.89に変換する方法を知る必要があります。

元のgroupbyのインデックスは必要ありません。行だけを列にする必要はありません。

+0

がどのようにディあなたがデータフレームを保存しますか? csvとして?特定の列を保存しましたか?あなたは[mcve]を提供してもらえますか? –

+0

私はデータフレームMDHを持っていました。私はgroupbyを使用しました: > MDH = MDH.groupby(['mes'、 'dia'、 'hora'])。次に、私はtxtを作成しました。> np.savetxt( 'MDH.txt'、MDH) –

+0

ああ、大丈夫です。それで 'np.loadtxt'がそれを行います。 –

答えて

0

np.loadtxtを使用すると、ファイルを自動的に読み取り、その内容を解析できます。

まず、私はいくつかのダミーデータを作成し、それを保存します。

In [627]: x = np.random.randn(35206, 12) 

In [629]: np.savetxt('MDH.txt', x) 

次に、私はnp.loadtxtを使用して、それをロードすることができます。

In [630]: y = np.loadtxt('C:/MDH.txt') 

In [631]: y.shape 
Out[631]: (35206, 12) 

In [632]: y.dtype 
Out[632]: dtype('float64') 
+0

解決済み、ありがとうございます。 –

+0

@AdolfoDonoso助けがあれば、この回答を受け入れることを検討してください。ありがとうございました :) –

関連する問題