partitioning

    0

    1答えて

    これは、世界の終わりではないにしても、有益で時間を節約できる問題について不思議です。 私はちょっと調べましたが、文字通り欲しいものは見つかりませんでした。また、 Running multiple R scripts/sessions 私はこのリンクをチェックしましたが、もう一度私を助けません。 私は大きなデータセットを使用しています(使用しようとするテストデータは約6.5m行と50列ですが、データ

    0

    1答えて

    サイズが100MBから20GBまでの一連のCSVファイルをロードしようとしています(合計3TB)。だから、できる限りのパフォーマンス向上が必要です。私はファイルグループ化と平均化のための分割を目指しています。私は最適なアプローチを見るために一連のテストを行った。 まず、さまざまなファイルグループの組み合わせを試しました。私が得意なのは、1つのファイルグループにあるテーブルにロードするときです。複数

    0

    1答えて

    テーブルの複数のパーティションにわたって更新スクリプトを実行する必要があります。私は以下のようにそれのためのスクリプトを書いた: が、それはを与える ORA-14108:不正なパーティション拡張表名の構文 原因:パーティションのみを指定することができるアクセスしますその名前を使ってユーザーがパーティション番号またはバインド変数を使用しようとしました。 処置:修正文がその名前 私はこのエラーを回避す

    0

    1答えて

    は、私は私のクラスタ上のいくつかの重い丸太をしました、私は次のパーティションスキーマでそれらのすべてをparquetedました2017/07/12から2017/08/10の間に効果的に行う方法はありますか?または、パーティションを1つずつ読み込むために全日ループする必要がありますか? おかげで、

    0

    1答えて

    分散マップの公式ドキュメントでは、 'EAGERはすべてのパーティションがロードされるまでロードがブロックされていることを意味します。そのマップのすべてのパーティションがロードされるまで、分散マップの操作がブロックされていることを意味しますか? 私のプロジェクトにはいくつかのかなり大きなストレージがあり、DBからの初期ロードには約20分かかります。すべてのパーティションが完全にロードされるまで、実

    0

    1答えて

    私は4つのパーティショントピック に、カフカHighlevelproducerとキー付きパーティションを使用しようとしています、私は以下のコードがあります。 var kafka = require('kafka-node'), HighLevelProducer = kafka.HighLevelProducer, client = new kafka.Client(Hos

    0

    1答えて

    私は約2Mlnのレコードを持つ大きなテーブルを持っていました。 私はID列をPRIMARY AUTO_INCREMENT intとしています(常にUNIQUEでなければなりません)。 私は "itear" int(4)の列を持っており、2016年から2050年までにBY RANGEを分割したいのです。ほとんどのQueryではWHERE文を1年ごとに使用しているためです。 パーティションを作成すると

    0

    1答えて

    です。まず、テーブルからMasterRecordsを選択し、次に各MasterRecordsに対して、子ローと各子ローをフェッチする必要があります。処理し、チャンクを書く。 これを行うために、私はSpringバッチでPartitionerを使用し、これを達成するためのマスターとスレーブのステップを作成しました。実行時コンテキストに追加された同じシーケンスでスレーブステップを実行する必要がなければ、

    0

    1答えて

    私はTableauのデータソースとしてテーブル(最大2000万行まで)を作成する必要があります。 テーブルの分割やその他の方法では、この特定のテーブル内のすべてのデータのみが必要ですか? 助けてください。

    0

    1答えて

    私はN(ポジティブ)ポイントの配列を持っています。私はすべての棒が同じ高さを持つようにヒストグラムのM個のビンの辺を見つけたいと思います。言い換えれば、2つの連続するビンエッジ間の配列ポイントの数が同じになるように、M + 1ポイントを探したいと思います。 例 >>> array = [0.3 0.3 0.3 0.7 0.8 0.9] >>> M = 2 >>> binPartition(ar