Pandasを使用してPythonでWebログテキストファイルをインポートしています。 Pythonはヘッダーを読み込んでいますが、ヘッダーとして "Fields:"というテキストを使用し、最後に空白(NaN)の列を追加しています。このテキストを列見出しとして使用しないようにするにはどうすればよいですか?ここPythonを使用してテキストを列見出しとしてスキップする方法
は私のコードです:ここでは
arr = pd.read_table("path", skiprows=3, delim_whitespace=True, na_values=True)
は、ファイルの先頭である:
ソフトウェア:Microsoftインターネットインフォメーションサービス7.5
バージョン:1.0
日:2014- 08-01 00:00:25
フィールド:日付時刻
2014年8月1日午前〇時00分25秒...
結果は、「フィールド」は、列見出しとして使用されているとNaN値の完全な列が列「時間」のために作成されていることです。
おかげで、私は回避策としてということでしたし、戻って使用して列見出しを追加しましたこのqanda:http://stackoverflow.com/questions/17018638/assigning-column-names-from-a-list-to-a-table間違ったテキストを読ませるのではなく、確かに良い方法があります。 – W4K1NG
ああ、私はあなたの質問を理解していませんでした。ファイルを編集して '' Fields: ''を' '''に置き換えるだけです(これはpythonスクリプトで 'replace'を使って行うことができます) – maxymoo