2016-03-19 11 views
2

awsアカウントに複数のs3バケットがあり、Rstudio Proを実行しているEC2マシンもあります。 S3バケット(それぞれ数テラバイトのデータ)にアクセスしたいと思います。RStudioServerのデータセットとしてAWS S3バケットに直接アクセスする方法はありますか?

バスタブをデータセットとしてマウントするためにrstudioをセットアップして、毎回それを読み取る前にEBSにすべてをコピーする必要がないようにしたいと考えています。

助けがあれば助かります。

+1

この非常に進行中のパッケージをご覧ください:https://github.com/cloudyr/aws.s3 – Thomas

答えて

2

に見えますcloudyr projecthttps://github.com/cloudyr/aws.s3aws.s3パッケージです。これにより

次のように、あなたがプライベートバケツにあなたのデータを持っていると仮定すると、あなたはそれにアクセスすることができます:

aws.s3::getbucket(
bucket = 'hpk', 
key = YOUR_AWS_ACCESS_KEY, 
secret = YOUR_AWS_SECRET_ACCESS_KEY 
) 

がうまくいけば、これはあなたのバケツからのデータにアクセスするのに役立ちます。 ec2マシンと通信するにはaws.ec2もお試しください。

+0

これをお探しいただきありがとうございます! –

+0

この方法は素晴らしいですが、私はRversionとの互換性を持ってすべての壁にヒットし、aws.s3プラグインが動作するバージョンやRのセットバージョンをインストールする方法を確認する方法はわかりません。 Getting: プラグインをインストールしようとすると 'package' aws.s3は利用できません(Rバージョン3.2.4改訂版) プラグインをインストールしようとすると –

+0

@ JoshBeauregardこのパッケージはインストールガイドからインストールし、CRAN https: /github.com/cloudyr/aws.s3#installation –

0

Pythonでのこれらのタイプのタスクのパッケージは、botoです。私はこれを試していないが、場合には、あなたが、これは便利かもしれませんR.

用移植版が存在しないように、それはそれはあなたが試みることができるようだRS3 ...

関連する問題