2016-08-27 8 views
1

予測モデリングの練習をしているとき、私はフラグの使用を理解できませんでした。私はそれをgoogled私は最高の説明を見つけることができませんでした。パンダの "flag"の使用方法

train = pd.read_csv('C:/Users/Analytics Vidhya/Desktop/challenge/Train.csv') 
test = pd.read_csv('C:/Users/Analytics Vidhya/Desktop/challenge/Test.csv') 
train['Type'] = 'Train' #Create a flag for Train and Test Data set 
test['Type'] = 'Test' 
fullData = pd.concat([train,test], axis=0) #Combined both Train and Test Data set 

あなたは、Python pandasのフラグ手段を何説明し、フラグの重要性は何ができます。ありがとうございました。

+1

複数のデータセットをまとめて '連結'する必要がある場合でも、どのデータがどのデータセットから来たものかを区別できる場合は、他にどのような方法を使用するといいですか? – Aprillion

+0

ありがとうございます@Aprillion私は考えを得る! –

答えて

2

私はそれが一例として、それを示すために、簡単かつ迅速だと思う:

In [102]: train = pd.DataFrame(np.random.randint(0, 5, (5, 3)), columns=list('abc')) 

In [103]: test = pd.DataFrame(np.random.randint(0, 5, (3, 3)), columns=list('abc')) 

In [104]: train 
Out[104]: 
    a b c 
0 3 4 0 
1 0 0 1 
2 2 4 1 
3 4 2 0 
4 2 4 0 

In [105]: test 
Out[105]: 
    a b c 
0 1 0 3 
1 3 3 0 
2 4 4 3 

はのは、各DFにType列を追加してみましょう。

In [106]: train['Type'] = 'Train' 

In [107]: test['Type'] = 'Test' 

今マージ/さんが参加してみましょう(垂直)の両方DF - Type列は、2つの異なるDFのデータを区別するのに役立ちます。

In [108]: fullData = pd.concat([train,test], axis=0) 

In [109]: fullData 
Out[109]: 
    a b c Type 
0 3 4 0 Train 
1 0 0 1 Train 
2 2 4 1 Train 
3 4 2 0 Train 
4 2 4 0 Train 
0 1 0 3 Test 
1 3 3 0 Test 
2 4 4 3 Test 
+0

ありがとうございます@マックス私は非常に明確な例を見つける。 –

+0

@ K.ossama、あなたは大歓迎です! :) – MaxU

関連する問題