0
私は、次のファイルを持っている:私はこのファイルからパンダDFを作成するには、文字列またはUnicodeインデックス列として列契約を使用したい番号
Contract, FG
9896342,Y
11037874,Y
6912529,Y
9896652,N
363291,Y
7348524,Y
6078482,Y
7795457,N
2486242,Y
3297980,Y
9760560,Y
1200533,N
11033963,N
7861603,Y
8218268,Y
9760247,Y
を。数字のように見えますが、技術的には文字列です。
私はこれでした:DF = pd.read_csv('C:\\Users\\S.Benet\\Desktop\\test.txt', index_col='Contract', dtype=object, encoding = 'utf-8')
をしかし、インデックスがINTとして解釈されます。
>>DF.index
Int64Index([ 9896342, 11037874, 6912529, 9896652, 363291, 7348524,
6078482, 7795457, 2486242, 3297980, 9760560, 1200533,
11033963, 7861603, 8218268, 9760247],
dtype='int64', name=u'Contract')
強制的に文字列インデックスにすることはできますか?
を。 1つのコマンドラインでこれを行う方法はありますか?それとも絶対に2つのステップで行う必要がありますか? – Steven
もちろん、1行で書くこともできます: 'df = pd.read_csv( 'data'、dtype = object、encoding = 'utf-8')。set_index( 'Contract')'。 – unutbu