2016-04-07 4 views
1

私はバルセロナの.csvファイルの詳しい情報をAirbnbのページhttp://insideairbnb.com/get-the-data.htmlから読み込もうとしています。カンマをたくさん含む変数「コメント」を使用してCSVファイルを読むにはどうすればよいですか?

しかし、問題は、人々からのコメント専用の変数があり、カンマがたくさんあることです。したがって、.csvファイルを読み込もうとすると完全に歪んでいます。私はいくつかの助けに感謝します!

ありがとうございました!

+0

'read.csv( 'reviews.csv')'は私のためにはうまくいきました。実際にどのコードを使用しましたか?コメントは引用符で囲まれているので、それらは問題ではありません – rawr

答えて

1

あなたはSEP2パラメータを使用して、data.tableパッケージからのfread()を使用することができます。ドキュメントから

SEP2:列内の区切り。

アムステルダムのデータで試してみましたが、うまくいきました。それは警告を投げますが、それはfreadがdata.table開発者によってプログラムされている方法によるものです。

DT = fread(".../location/reviews.csv", sep2=",") 
nrow(DT) #returns 163351 (which seems to be the correct number) 
head(DT$comments,1) 

リターン:

[1]「部屋は小さいながらも快適だった場所は非常にきれいだったが、ベッドのシーツは、ちょうど約20のアパートはきれいに飾られていたクリーナーされていると置かれている可能性があります。。市内中心部から歩いてすぐのところに歩いていたので、とても便利でした。しかし、木曜日の夜、午前5時30分までパーティーをすることを決めたので、とても不愉快な体験をしました。非常に薄く、一晩中彼らの音楽と会話を聞くことができた。人々はまた一晩中喫煙していたので、タバコのにおいは私たちがsmではないので耐えられなかった私たちの部屋の臭いはとても強かった。 Cedariaは、私たちの街で参照するには、物事についての手の前にヒントを与えることに非常に有用だったが、我々は我々がどこかに滞在していた経験のようなものを持っているだろうことを知っていたら。」

FYI、関数freadと私はそのパッケージを使いたいと思っています。

+0

大変ありがとうございます!それは完全に動作します!このパッケージを念頭に置いて、本当に便利です! – adrian1121

+2

'sep2'はまだ実装されていないと思いますか? –

+0

私は思いませんそれは、ドキュメントがそれを記述する方法で実装されています。文字列のリストの列を返しません。私はこれまでこの目的のために使ってきたことを知っていて、それはうまくいった。 –

関連する問題