2016-11-14 6 views
-1

データフレーム列から一部のデータを読み込んでいます。値に " - "が含まれている場合は、各値を操作します。これらの操作には、 " - "に基づく分割が含まれます。リスト内の各値は、インスタンスのように "\ nの*を" 持っている理由しかし、私は理解していないpythonリストに自動的に不要な特殊文字が含まれています。 n +

[ '2010 \ N1'、 '200 \ n2の450 \ N3'、...、 '

splited = [] 
    wantedList = [] 

    val = str(x)      # x represents the value in the value read from the dataframe column 

    print val       # the val variable does not does not contain those special characters 

    if val.find('-') != -1:    
      splited = val.split('-') 
      wantedList.append(splited[0]) 

    print splited      # splited list contains those special characters 

    print wantedList     # wantedList contains those special characters 

私はこれは私がリストを作成した方法または私はそれに追加しています方法に関係してい推測:1239 \ N1000' ]ここ

は、私のコードのサンプルです。

このような何かが

+0

あなたはあなたが読んでいる日付を提供できますか? splittedデータ( 'splited [0]'を 'splited [0] .strip()'に置き換えて)に 'strip'を使ってみましたか?少なくとも、「val」の例を提供できますか? –

答えて

3

おそらくが自動的あなたの内のいくつかのランダムな位置で改行文字を追加することができ、あなたのコード内では何もありませんが起こるのない、なぜ誰もが知ってい文字列。文字はすでに文字列に入っていますが、print\nとして表示されていませんが、新しい行として表示されます。

あなたは、文字列の表現を印刷していることを確認することができます

print repr(val) 

あなたは、文字列からそれらをしたい場合は、可能なすべての\nためのシンプルなstr.replaceで。

+0

print repr(val)はそれを示しましたが、str.replaceはそれを見ていません。したがって、リストは同じままです。これは、 'splitted2 = [t.replace( '" \\ "n'、 '')のsplittedのコード]'であり、 'print splited2'は差異が表示されません – akaAlso

+0

どうもありがとう。私は 't.replace( '" \\ "n"、' ')の代わりに単純な 't.replace(' \ n '、' ') – akaAlso

関連する問題