Kaggleの解からのコードを理解できません。ここで配列のnumpy条件を理解する
は、データの一例である:
PassengerId,Survived,Pclass,Name,Sex,Age,SibSp,Parch,Ticket,Fare,Cabin,Embarked
1,0,3,"Braund, Mr. Owen Harris",male,22,1,0,A/5 21171,7.25,,S
2,1,1,"Cumings, Mrs. John Bradley (Florence Briggs Thayer)",female,38,1,0,PC 17599,71.2833,C85,C
3,1,3,"Heikkinen, Miss. Laina",female,26,0,0,STON/O2. 3101282,7.925,,S
目標は、唯一の女性で、配列を抽出することである、と彼らはこのようにそれを実行します。
# data contains all the passengers
women_only_stats = data[0::,4] == "female"
females_data = data[women]
print(data[women][0]) # Will print the first women of the dataset of only women.
私はwomen_data_only
がすることを理解します式data[0::,4] == "female"
の評価の結果であるTrue
とFalse
の配列であること。
私が理解していないのは、なぜデータ[女性]が女性だけの配列であるかです。
numpy
はどのように評価されますか?ここで
これは次のとおりです。[ブール型または「マスク」インデックス配列](http://docs.scipy.org/doc/numpy/user/basics.indexing.html#boolean-or-mask-index-arrays) –
"ブールインデックス"を検索 –
非常に参考になりました、ありがとう! – Mornor