2017-02-09 7 views
-1

私はAzureをPay-as-you-goサブスクリプションで使用しています。私は自分自身でHDInsight経由でSparkクラスタを作成した経験があり、予想以上の費用がかかりました。その後、私は経済的な方法でそれを使用する方法を捜し、人々がコストを節約するためにクラスタを正常に削除することを発見した。個々のユーザーがSparkクラスタを小規模な費用で使用するための他の方法があるのだろうかと思います。コストを節約するために使用できる他のサブスクリプションはありますか?前もって感謝します。Azure HDInsightの使用方法less charge

+1

あなたはどのサイズのVMを選択しましたか?あなたの作業負荷に応じて、より経済的なサイズも機能します。 – GregGalloway

+0

D12(4コア)とD4(8コア)を使用しました。私はD4がこのページ(https://azure.microsoft.com/en-au/pricing/details/hdinsight/)からかなり高価だとわかりました。 –

答えて

1

クラスタの作成と削除は、PowerShellまたはARMテンプレートを使用して自動化できます。あなたは正しいのが典型的なパターンです。

大きなデータを対象にしていますが、クエリごとの支払いモデルであるAzure Data Lake Analyticsを見てください。

+0

私は参照してください。 PowerShellを使用してクラスタを作成および削除するプロセスを自動化し、わずかなコアでより小さいVMサイズを使用するようにしてください。それは合理的に充電を減らすでしょう。私はAzure Automationを使用する方法についての記事も見つけました(http://www.datamic.net/blog/automate-provisioning-hdinsight-clusters-with-powershell-and-azure-automation)。ありがとう –

+0

また、作成時に特定のアクティビティを自動化するスクリプトアクションもご覧ください。これにより、カスタマイズを再作成する時間を節約できます。 –

0

また、データセット、特に必要のない大きなデータセットに注目してください。処理のための効率的な円柱フォーマット(Parquet、ORC)を持っていることを確認してから分割可能な圧縮(bzip2、LZO、スナッピー)で圧縮してください。

データセットを永続化するよりも、データセットを再計算する方が安いことさえあります。

WASBで必要以上に多くのデータを誤って保持することは非常に簡単です.WASBは、クラスタがダウンしても請求書を実行します。

最後に、クラスタが破損していることを確認してください。少なくともAWSクラスタでは、Jenkinsを使用してスケジュールに基づいてクラスタを開始/停止することが一般的です。 Azureの自動化がAzureのためにうまく動作するように見えます。

関連する問題