2016-04-09 5 views

答えて

3

うあなたがそれを読んだ後でただ列を削除するだけで十分ですか?これは機能的には、最初の列を読み込みから除外することと同じです。ここでおもちゃの例です:

import numpy as np 
import pandas as pd 
data = np.array([[1,2,3,4,5], [2,2,2,2,2], [3,3,3,3,3], [4,4,3,4,4], [7,2,3,4,5]]) 
columns = ["one", "two", "three", "four", "five"] 
dframe_main = pd.DataFrame(data=data, columns=columns) 
print "All columns:" 
print dframe_main 
del dframe_main[dframe_main.columns[0]] # get rid of the first column 
print "All columns except the first:" 
print dframe_main 

出力は次のとおりです。

All columns: 
    one two three four five 
0 1 2  3  4  5 
1 2 2  2  2  2 
2 3 3  3  3  3 
3 4 4  3  4  4 
4 5 2  3  4  5 

All columns except the first: 
    two three four five 
0 2  3  4  5 
1 2  2  2  2 
2 3  3  3  3 
3 4  3  4  4 
4 2  3  4  5 
3

私はusecolsパラメータを使用することをお勧めします:

usecols:配列のような、デフォルトなしのサブセットを返しません列。

の結果、解析時間が大幅に短縮され、メモリ使用量が大幅に削減されます。

In [32]: list(range(5))[1:] 
Out[32]: [1, 2, 3, 4] 

dframe_main = pd.read_table('/Users/ankit/Desktop/input.txt', usecols=list(range(5))[1:]) 

あなたのファイルが5列を持っていると仮定すると、

関連する問題