data-processing

    -1

    1答えて

    SQLテーブルにはいくつかのデータが用意されていますが、いくつかのルールに従って変換する必要があります。 しかし、この変換では列名を動的にアドレス指定する必要があります。つまり、値を格納する列の名前自体が他の列などに値として格納されます。 また、値が異なる列の範囲に存在するかどうかによって、 1つの入力行に対して複数の出力行を生成する必要があるので、これは一種の転置です。 私は、例を用いてそれを示

    4

    2答えて

    私は以下の表のようなpythonでデータのリストを持っています。 基本的には、私たちの迷路/アリーナでロボットが何をしているかを観察することによって生成されます。イベントのタイムスタンプはありますが、タイムスタンプはイベント駆動型であり、周期的ではありません。 各アリーナで費やされる時間を効率的に見つける必要があります。 TimeStamp Arena 101 Arena A 109

    1

    3答えて

    私は約10 GBのテキストファイルを持っています。ファイルのテキストデータを処理する必要があります。 このような膨大なファイルを読み込み、アクセスして処理する最も良い方法は何ですか? 私は、ファイルを塊に分割し、小さなファイルを処理することで処理します(または、バッファに入れることができます)。そして、結果をマージします。もっとmap-reduceパラダイムに似ていますが、それは大きなデータ技術を

    0

    2答えて

    私はC++ソケットプログラミングの初心者です。私はしばらくの間処理しようとしているという問題があります。 私の仕事は、2つの異なるセンサーから受信したデータを処理することです。私はUDPソケットを介してデータを受信し、パケットを処理します(明らかにすべてがwhileループで発生します)。リアルタイムのビジュアライゼーションにデータを使用するので、プロセス全体を迅速にする必要があります。 1つのセン

    0

    3答えて

    ユーザーの同じ表に2つの列があります:name-displayedとshort-nameです。 name-displayedには、「John Doe」などのユーザーのフルネームが入力されます。 short-nameには、短い値があります。 "ジョン・ドゥー"(本質的に大文字とハイフン)。 name-displayedのデータに基づいて、short-nameのデータをどのように修正しますか?私はUP

    2

    3答えて

    論理/バイナリデータフレームの同じ列名をマージします。つまり、出力は4列(リンゴ、キウイ、バナナ、オレンジ)のデータフレームでなければなりません。 は、私が試した: testmerge <- df[, !duplicated(colnames(df))] しかし、出力は私が探したものではありません。同じ列名が与えられた行ごとに、少なくとも1つのTRUEがある限り、出力はTrueでなければなりま

    1

    1答えて

    は、私は、ファイルに保存されている同様の構造文字列のリストを持っていると言う: Jenny lives in New York. She is 22 and a machinist. Tommy lives in Los Angeles. He is 21 and a ballet dancer. Kevin lives in Boston. He is 7 and jobless. 今私

    -2

    1答えて

    こんにちは私は大量のデータを扱うプロジェクトに取り組んでいます。私は約2 GBのキー値のペアを持つテキストファイルを持っていて、各キーには複数の値があります。 特定の機能をテストするためのキーが必要なので、私は別のファイルのすべてのキーを抽出する必要があります。 ファイルの形式は次のとおりです。 :k: k1 :v: {XYZ:{id:"k1",score:0e0,tags:null},ABC:[

    1

    2答えて

    データがあります。さんが言ってみましょう: date,comments 19-Apr-2016,Today was great. 21-Apr-2016,Today was not so great. 1-May-2016,Interesting things happened! (すべての日付はもちろんの日付として解析されます) 私は5月1日2016年4月19日、2016年から毎日通過

    0

    1答えて

    約50000回の失敗回数データを持つ大きなデータに指数関数的なSRGMを適用しようとしています。これは永遠に実行されており、データポイントが多すぎるため、オンラインツールでもこの​​データがクラッシュしています。この問題を解決し、MLE(最尤推定)を得るためにExponential(Goel-Okumoto)モデルをどのように適合させることができますか?