私のデータフレームには、半構造化されたデータが列にあります。 「|」私が前に最初の単語だけを抽出したいこのdataframe$col1
からR内の列を分割する
df
col1
a|b|c
a b1|b|c
a & b2|b|c 3
。
私はこの
df$col2 <- unlist(strsplit(as.character(df$a),"[|]"))[[1]][1]
を使用してみましたが、結果はすべての行の「A」の同じ値を持っていました。 これはどうしてこれを処理するのですか?
おかげ
あなたの予想される出力は何ですか?おそらく 'ライブラリ(stringr); str_extract(df $ col1、[[:alnum:]] +(?= \\ |)") ' – akrun
'ライブラリ(tidyr); – alistaire
[列要素を3つの別個の列に分ける(R)]の重複可能性があります。df%>%分け(col1、into = 'col2'、sep = '\\ |'、余分= 'drop'、remove = FALSE) (http://stackoverflow.com/questions/25194174/separating-a-column-element-into-3-separate-columns-r) – alistaire