bigdata

    1

    2答えて

    私は360GBの圧縮(gzip)のパイプ区切りテキストファイルを持っています。 1,620を超える列があります。私は正確なフィールド名を示すが、ここではそれが基本的に何をすることはできません。 primary_key|property1_name|property1_value|property800_name|property800_value 12345|is_male|1|is_colle

    0

    1答えて

    これを行う簡単な方法が必要ですが、私はSQLで非常に新しいです。私は大規模な調査からこのデータを得ました。私はこれに助けが必要です。私は宿題の平均時間と合計時間を各クラスから求めたいが、データはすべての等級が1つのテーブルにあるようにフォーマットされている。それは難しいことではありませんが、私はそれを理解することはできません。ありがとう! SELECT What_grade_are_yo

    4

    1答えて

    比較的大きなデータセットにgeneralized linear mixed-effects modelsをフィッティングする戦略の提案を探しています。 私は、米国バスケットボールパスの8 millionのデータを10年間で約300チームで持っています。 data <- data.frame(count = c(1,1,2,1,1,5), length_pass= c(1,2,5,7

    -1

    1答えて

    次のuseridは 1 - > 2(IE)が1は、以下の2 1 - > 3 3 - > 5 2 - > 3 アイデアは、私は二人が目の例では を持っているどのように多くの一般的な信者を知りたいです上記の場合、ユーザ1とユーザ2の両方がユーザ3に従うので、ユーザ1とユーザ2の間の相互フォロワの数は1です。 巨大なデータセットに対してこれを実装する最も良い方法は何ですか?ユーザーIDで簡単に収集してか

    3

    2答えて

    私はメモリにロードできない非常に大きなデータセットを持っています。 私は、このデータセットをscikit-learnクラシファイアのトレーニングセットとして使用したいと考えています。たとえば、LogisticRegressionです。 ミニバッチを提供するscikit-learnクラシファイアのミニバッチトレーニングを実行する可能性はありますか?

    -1

    1答えて

    TableauまたはPowerBIからdb/cube/etcを照会している人や企業が、5秒未満の応答で、場合によっては1秒未満で照会することがあります。彼らはどのようにこれを行うのですか?データは鰓に最適化されていますか?彼らは大規模なDbを使用していますか? 関連する質問では、私はSQL DWに対してTableauを使用してはるかに小さなデータセット100m行を分析することを試してきましたが、計

    0

    1答えて

    ここにマーカー付きのGoogle静的地図を印刷しようとしています。私は大量(約200以上のマーカー)のカスタムマーカーをGoogle静的マップにロードしようとしていますが、そのタイムマップは空白で表示されています。ここで私はマーカーアイコンのURLと緯度、長さを減らしましたが、 。問題を解決するために私を案内してください、私は私のコードを与えています。この問題を解決するのに役立ちます。 var s

    4

    4答えて

    私はプロジェクトに取り組んでいます。私は次のシナリオで立ち往生しています。 Iテーブルを持っている:superMerge(ID、名前、給料) 及びI 2つの他のテーブルを有する:TABLE1および表2 すべてのテーブル(テーブル1、表2及びsuperMerge)は、同じ構造を有しています。 私の挑戦は、table1とtable2のsuperMergeテーブルを挿入/更新することです。 テーブル1は

    1

    3答えて

    特定の文字列が発生する回数をカウントする必要がありますが、1つのIDが同じ文字列を複数回含む場合は、1回だけカウントします。基本的には、IDに対して一意的に発生する文字列の出現回数を数える必要があります。これは簡単なことだと思いますが、私が何をしているのか分かりません。ここに私の現在のコードは次のとおりです。 SELECT RXNAME as Name, DUPERSID as ID, CO

    0

    1答えて

    新しい投稿がユーザーの定義したルールと一致したときに通知をトリガーするシステムを構築する必要があります。 など。 システムにはユーザーのリストがあります(何百万と言いましょう)。そして、追加された投稿のストリームがあります(また、大量)。 新しい投稿が自分が定義したルールに一致すると通知を受けたいユーザーもいます。 ルールは、どの単語を投稿に含めるべきかを記述するブール式です。 例えば、利用者Aは