私はPandasで処理しているExcelファイルとは異なります。私は各ファイルの先頭から特定の数の行を削除する必要があります。これらの余分な行は空でも、テキストを含むこともできます。パンダはいくつかの行を組み合わせているので、削除する必要があるかどうかはわかりません。例:ここではパンダは、Excelファイルの空の行をデータフレームの単一の行に結合します。
は一例です(CSVとして表される)ファイルをエクセル:ここ
,,
,,
some text,,
,,
,,
,,
name, date, task
Jason,1-Jan,swim
Aem,2-Jan,workout
は私の現在のPythonスクリプトです:私は、データフレームを印刷するときここ
import pandas as pd
xl = pd.ExcelFile('extra_rows.xlsx')
dfs = xl.parse(xl.sheet_names[0])
print ("dfs: ", dfs)
は結果です。
dfs: Unnamed: 0 Unnamed: 1 Unnamed: 2
0 some other text NaN NaN
1 NaN NaN NaN
2 NaN NaN NaN
3 NaN NaN NaN
4 name date task
5 Jason 2016-01-01 00:00:00 swim
6 Aem 2016-01-02 00:00:00 workout
ファイルからは、最初の6行が削除されます。しかし、データフレームからは私は4つしか削除されませんでした。行の数が一貫しているように、Excelファイル内のデータを元の状態で読み込む方法はありますか?ここで