2016-05-30 7 views
1

つぶやきがたくさんあるRスクリプトがあります。同じデータを同じスクリプトで使用したいが、Hadoopファイルシステムに保存したいと思っています。 this Hortonworksチュートリアルによると、私はHDFSのデータでRコードを使うことができましたが、それははっきりしていません。hadoopとmapreduceでRスクリプトを実行しています

このRevolution Rを使用してmapreduceパラダイムを利用して、非常に同じRスクリプトを使用できますか?コードを変更するか、Hadoopアーキテクチャに最適化された同じ関数を実行する方法はありますか? 私の願いは、R-Studioのような標準的なR IDEに自分のコードを書いて、それを使ったり、クラウドサービス(Microsoft Azureなど)でbaseをmapreduceで使ったりすることです。

+0

私たちは、あなたのスクリプトの詳細を知っておく必要があるだろう - たくさんテキスト分析はちょうど分割とカウントで、これは並行して実行するのが比較的簡単ですが、他の操作は非常に困難です。 –

答えて

0

はい、環境固有の計算コンテキストを使用して、HadoopからSpark、Teradata、SQL Serverまで、さまざまなデータプラットフォームで任意のRスクリプトを実行できます。

次の二つのリンクはHadoopの上革命R /マイクロソフトR Serverを使用する方法に始めるのに役立つはずです。

https://msdn.microsoft.com/en-us/microsoft-r/scaler-hadoop-getting-started

https://github.com/Azure/Azure-MachineLearning-DataScience/blob/master/Misc/MicrosoftR/Samples/NYCTaxi/NYC2013_MRS_LinearBinary.Rmd

関連する問題