2017-12-31 215 views
0

RFacebookパッケージを使用して投稿からコメントを抽出する際に問題が発生しています。R:<>ユニコードからレターへのエンコード

localiza <- getPage(543362459038077,token = my_oauth,n=10) 
post <- getPost(post = localiza$id[1], token = my_oauth) here 

問題は、出力のエンコードです。たとえば、次の代わりに "/" で、出力ワードは、例えば、のように表示されます<>

を有する

algu/U + 00E9/M

alguém

提案がありますか?

ありがとうございます!

答えて

1

localeを変更することを検討してください。 Rfacebookでは問題ありません。ロケールをCに設定することで説明した動作を再現できます。拡張文字セットを使用して一つに扱う文字セットのロケールを切り替えることにより

x <- "Boa tarde. Há alguém de plantão na agência esses dias?" 
Sys.setlocale(locale = "C") 
x 
# [1] "Boa tarde. H<U+00E1> algu<U+00E9>m de plant<U+00E3>o na ag<U+00EA>ncia esses dias?" 

、所望の出力が達成され、例えば

Sys.setlocale(category = "LC_CTYPE", locale = "en_US.UTF-8") 
x 
# [1] "Boa tarde. Há alguém de plantão na agência esses dias?" 

あなたのシステムでは、locale引数の値が異なる場合があります。ロケールの設定の詳細については、https://stat.ethz.ch/R-manual/R-devel/library/base/html/locales.html(または?locales)を参照してください。

+0

それは魅力的に機能しました! ありがとうございました! –

関連する問題