2017-02-09 15 views
1

私のCSVファイルでは、各行はデリミタ"$$$Field$$$"(単純な文字列で、正規表現ではない)で区切られています。私は次のことをしようとしていますが、セパレータを無視しています。パンダ:CSVファイルの区切り文字として全文を使用

df = pd.read_csv('filename.csv', sep='\b$$$Field$$$\b') 

+0

セパレータを無視しているので、自動的にこれを判断します(間違ったタブを選びます) – Arturo

+0

'sep = \ b $$$ Field $$$ \ b'これは有効なPythonコードではありません。 –

答えて

3

あなたが脱出する必要があるようだ$\によって:

import pandas as pd 
from pandas.compat import StringIO 

temp=u"""Food$$$Field$$$Taste 
Apple$$$Field$$$a 
Banana$$$Field$$$b""" 
#after testing replace 'StringIO(temp)' to 'filename.csv' 
df = pd.read_csv(StringIO(temp), sep='\$\$\$Field\$\$\$',engine='python') 
print (df) 
    Food Taste 
0 Apple  a 
1 Banana  b 

read_csvドキュメント:

9月

:STR、read_csvのためのデフォルト ''()、\ tのread_table()

デリミタを使用します。 sepがNoneの場合、これを自動的に判断しようとします。 1文字より長く、 '\ s +'とは異なるセパレータは正規表現と解釈され、python解析エンジンの使用が強制され、データの引用符は無視されます。正規表現の例: '\ r \ t'

関連する問題