2016-09-05 3 views
3

私のExcelシートを認識しません:Pythonのパンダread_excelはヌルセルに

A B 
1 first second 
2 
3 
4 x y 
5 z j 

Pythonコード:

df = pd.read_excel (filename, parse_cols=1) 

リターン正しい出力:

first second 
0 NaN NaN 
1 NaN NaN 
2 x  y 
3 z  j 

私は仕事したい場合第2列の場合

df = pd.read_excel (filename, parse_cols=[1]) 

リターン:

second 
0 y 
1 j 

私は特定の列でのみ動作していても、私は(私のDFでのNaN)空のExcelの行についての情報を持っていると思います。 出力、それはOKではない緩いNaNの情報、例えば、のskipRowsののparamaterのため、など私にとって

おかげ

+1

パラメータ 'skip_blank_lines = False'を試してみませんか? – jezrael

+0

それは動作します。なぜ私はここでこのパラメータを見ることができません:http://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_excel.html –

答えて

4

は、パラメータskip_blank_lines=Falseを動作する場合:

df = pd.read_excel ('test.xlsx', 
        parse_cols=1, 
        skip_blank_lines=False) 
print (df) 

     A  B 
0 first second 
1 NaN  NaN 
2 NaN  NaN 
3  x  y 
4  z  j 

場合や、最初の行を省略必要があります。

df = pd.read_excel ('test.xlsx', 
        parse_cols=1, 
        skiprows=1, 
        skip_blank_lines=False) 
print (df) 

    first second 
0 NaN NaN 
1 NaN NaN 
2  x  y 
3  z  j 
+0

はい、それは動作します。しかし、なぜ私は公式文書にこのパラメータが見当たらないのですか? http://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_excel.html –

+0

[docs]の「一般的な解析設定」(http://pandas.pydata.org/pandas-docs/stable)を参照してください。 /io.html#io-read-csv-table)、またはこのパラメータは[read_csv'](http://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_csv.html)にあります。 – jezrael

+0

公式のdocs - ['read_excel'](http://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_excel.html)' ** kwds'の後ろです( – jezrael