NYC 2011で生まれた赤ちゃんのコホートでレースで最も頻繁に1位を獲得しようとしています。これはデータセットの外観です以下のような:レース(文字列)で最も頻繁に(数値)の名前(文字列)を印刷
は、私は女性人口(GNDR = "FEMALE")
から(ETHCTY = "BLACK NON HISPANIC")
黒と白の(ETHCTY = "WHITE NON HISPANIC")
サブグループのための最も一般的な(RNK = "1")
名(NM)
を表示したいです。
私はsubset
機能を試しました。ここで私が試したコードは次のとおりです。
subset(Baby.names.ethnicity.NYC, select = c(NM, subset=(RNK > 10))), + subset=c(ETHCTY == "WHITE NON HISPANIC" & ETHCTY == "BLACK NON HISPANIC" & GNDR == "FEMALE")
この論理式が必要なように見えます: 'data [data、ETHCTY%in%c(" WHITE NON HISPANIC "、" BLACK NON HISPANIC ")&RNK == 1&GNDR ==" FEMALE " ] ' –
また、あなたのコード' ETHCTY == "WHITE NON HISPANIC"&ETHCTY == "BLACK NON HISPANIC"は 'ETHCTY ==" WHON NON HISPANIC "でなければなりません。 ETHCTY == "BLACK NON HISPANIC" 'どちらかが欲しいからです –
ありがとう、@リチャード・スクリブン! –