2012-01-20 6 views
0

HadoopとHbaseを使用してプロジェクトを開始するだけで、どのプラットフォームを使用するのか混乱しました。 Hadoopは実際にはUNIXベースのシステム向けに作られているようですが、Cygwinの助けを借りてWindowsで実行できるようです。HbaseでHadoopを実行するためのプラットフォーム

Windowsが選択された場合、またはUnixベースのシステムと同じように動作する特定の問題に直面する必要がありますか。私たちのプロジェクトは、Webクローラによって作成されたデータをソートし、map/reduceテクニックを使用して簡単な検索インターフェイスを作成することに基づいています。

経験があれば、UbuntuのようなWindows/Unixベースでの相違について説明することができます。

PS:Hadoopのは、Windowsボックス上で生産にお勧めされていない今のところ、我々は窓

+0

IMO始めると、Cloudera VMイメージを使用する方がずっと簡単です。 –

+1

Windows上のHadoopは本番環境ではサポートされていません。なぜなら、問題がなければマイクロソフトはどうして迷惑をかけるべきなのかという理由から、あなたは何か問題にぶつかるでしょう。 – Brainlag

答えて

1

での作業がより快適です。 HortonWorksとMicrosoftは、HadoopをWindows ServerとAzureに移行する作業を進めています。現在はdeveloper previewにあり、安定して公開されるまでには時間がかかることがあります。開発目的のために、Windows上のHadoopはOKであるはずですが、わかりませんが、Hadoopの機能の一部が動作しない可能性があります。 Windows上でHadoopを設定する場合はtutorialです。

PS:コメントで述べたように、我々は窓

での作業がより快適で、VM PlayerまたはVirtualBoxのハイパーバイザーにインストールすることができますLinux上でのHadoopのためのVMのカップルがあります。 VirtualBoxでCloudera CDHを使い始めるにあたり、tutorialがあります。 Cloudera CDH VMには、いくつかのApacheフレームワーク(Hadoop、Pig、Hive、Sqoop、HBaseなど)がインストールされ、構成され、統合され、テストされています。もう一つの選択肢は、簡単に始めるためにAmazon EMRを使用することです。

私はまた、Linux環境に慣れて慣れておくことをお勧めします。 Linuxは他のOSよりも楽しいです。 thisなどのチュートリアル/記事の始め方がたくさんあります。

+0

情報ありがとうございます。私は今のところUbuntuを選んだ。 – qwerty123

関連する問題