2016-03-18 5 views
-3

ガレージ販売のサンプルを収集したとします。このサンプルでは、​​「追加説明」という名前の列があり、オプションの性質上、一部の項目が空で、その他は記入されています。これを因子列に変えれば、私は約五千の異なるレベルに終わるだろう。代わりに私はむしろ "追加の説明"がガレージの販売に役立つかどうかを知っているでしょうか。多くの異なる文字列を持つ列を2つのレベル係数列に変換するにはどうすればよいですか?

このため、空の行を因子属性 "N"に、空でない行を因子属性 "Y"に変えたいとします。どのような方法で私は自分の好みに合わせてデータを変えることができますか?

例:

データがどのように見えるか:

str(data) 
$ Additional Description: Factor w/ 2 levels "N","Y": 1 1 1 1 1 1 1 1 1 1 ... 
+4

は、データと予想される出力の例を教えてください。 – effel

+0

'df $ newcol < - is.na(df $ additional_description)'またはおそらく 'df $ newcol < - df $ additional_description ==" "'またはそれ以外のものかもしれません。例がないと伝えにくい。 – cory

+1

リンクやダウンロード、写真ではなく、質問にデータを投稿する必要があります。 [ask]と[mcve]を読んで、それに応じて質問を編集してください。また、この質問はRStudioとは関係がないので、タグを追加しないでください。 –

答えて

0

あなたが質問を投稿するたびに例をあげてみてください:

str(data) 
$ Additional Description: chr NA NA NA "New Products" "Outdoor Sale" ... 

はどうやってデータを見てみたいです。このしてみてください、あなたは「Y」のように「N」と、非空行として空行を作りたい望ん :

df$Additional.Description.New[!is.na(df$Additional.Description)] = "Y" 
df$Additional.Description.New[is.na(df$Additional.Description)] = "N" 
関連する問題