mapreduce

    0

    1答えて

    チュートリアルでハイブをインストールします: https://www.edureka.co/blog/apache-hive-installation-on-ubuntu その他のものです。 私はデータベース、テーブル、負荷データを作成するには、大成功であるが、別のマップ/皆のためのタスク hive> create database mydb; enter code here OK Time

    0

    1答えて

    私はHadoop/MapReduceを使用してムービーの推奨事項を作成しています。 私は、MapReduceプロセスを実装するためにpythonのみを使用しています。 私は基本的に、マッパーとレデューサーを別々に実行し、マッパーからレデューサーへのコンソール出力を使用しています。 私が問題になっているのは、Pythonが端末の文字列として値を出力するということです。数字を使って作業している場合、数

    2

    1答えて

    私は下記の定義と同様、他の機能(すなわち依存性注入)でパラメータ化することができ、私のMapReduceコードのためのヘルパー関数を定義したい : var helper = function(f) { return function(x) { return f(x); // just an example }; } はモンゴの呼び出しMapReduceは、私がス

    0

    1答えて

    私はこのmap-reduceのことでかなり新しいので、これを使って自分のサイトのユーザーをフィルタリングしています。 質問したいのはどのようにグループベースのフィルタリングを行うことができますか? シナリオを説明しましょう。 - ユーザーが特定の日付間に尋ねるクエリを除外したいとします。> from:-1/01/2016 To:-03/02/2016。 は、私が使用しています 私は、さらに私は、ク

    0

    1答えて

    IBM CloudandデータベースのMap Reduceプロセスを使用して24時間以内に作成されたドキュメントの数をカウントしたいと思います。ここに私の地図-削減コードです:削減の段階では function (doc) { docTime = (new Date(doc.created_at)).getTime(); currentTime = (new Date()).ge

    0

    1答えて

    を減らして検索し、そう 、私は展開を削減地図/たくさんの間の入力データのためのいくつかのヘビーデューティー処理を広めるためにしようとしています。私の質問は、どの展開が現在「アイドル」であるかをどのように見つけることができるのですか?さらに、ドキュメントを読むと、同じデプロイメントに対して何度も「サブミット」することができ、同じことを達成することができます(サブミットからヌルを取得します)。本当?

    1

    1答えて

    "otherCauseForRelease"属性を持つドキュメントを識別するためのビューを作成しようとしましたが、その属性には実際に値が設定されています。マイビューのコードは次のとおりです。 function (doc) { if(doc.payload.otherCauseForRelease.length > 5); emit(doc.payload.otherCauseForRelease

    0

    1答えて

    さらに何をすべきですか? hadoopシステムでこのjarファイルを実行すると、エラーメッセージが表示されます。 のHadoopジャーunits.jar /input_dir/sample.txt/OUTPUT_DIR /スレッド "メイン" にjava.lang.ClassNotFoundExceptionで 例外結果:java.lang.Class.forName0でtxtを /input_d

    1

    1答えて

    私は大きなオントロジー(.owl)を作成しましたが、今は推論のステップに入っています。実際には、問題は私のオントロジーのためのスケーラブルな推論を保証する方法です。私は文献を検索しましたが、Big Dataがそれに適したソリューションであることがわかりました。残念ながら、Map-reduceは入力OWLファイルとして受け入れることができません。さらに、SWRLという意味言語では、SPARQLは使用

    0

    2答えて

    sqoopにはいくつのデフォルトマッパーと減速機がありますか? (4マッパー、0レデューサー)。 --whereまたは--queryの条件をsqoop importに使用すると、そこにはいくつのレデューサーが含まれますか? ローカルクラスタでは、sqoopあたりユーザーガイドとして、ほとんどのデータベース・ソースから並列にSqoopインポートデータを--where or --query condi