group-by

    0

    2答えて

    フィールド上の条件で集計関数と集計関数を要約する際に問題があります。 例: df = tbl_df(data.frame( users=c("1", "1", "1", "1", "2", "2", "2", "3", "3", "4", "4", "4", "4"), projects=c("100", "101", "102", "103", "104", "105", "1

    0

    2答えて

    このケースを使用してデータを表示すると、whereとgroup byと表示されます。サンプルは18/12/2017です。 SELECT PROID, MAX(COUNT_NUMBER) AS COUNT_NUMBER_OLD, CONVERT(CHAR(10), DATETIME_INPUT, 101) AS PreDate FROM TABLE_A W

    0

    3答えて

    私はグループを使用できるデータセットを持っています。 例イベントテーブルが利用可能な場合、私は、好ましくは、null値を取得したい(イベントは終了していないかどうかを知りたい): ID event finished 1 event1 2017-01-01 2 event2 NULL 3 event3 2017-05-18 4 event1 NULL SQL: : SELECT even

    1

    1答えて

    RDDではgroupByKeyの使用をお勧めしていませんでした。reduceByKey()やaggregateByKey()などの代替手段を使用することをお勧めしました。これらの方法はそれぞれのパーティションで最初に減らされ、groupByKeyデータの量はシャッフルされます。 今、データセット/データフレームにこれが適用されるのかどうかという疑問があります。触媒エンジンは多くの最適化を行っている

    1

    3答えて

    私は3つのテーブルfinancial_years、house_details、consumer_detailsを持っています。私はSqlfiddleで私のスキーマを追加しました:http://sqlfiddle.com/#!9/dd527d/2と私の期待された結果は、以下の長さのためにラップされます。私が試したクエリがあります。 問合せ: SELECT c.consumer_name as Nam

    0

    2答えて

    をグループ化するORDERとGROUP BY私は2つのテーブルがあります。 CREATE TABLE Person { ID INT PRIMARY KEY, Name VARCHAR(50) NOT NULL, Surname VARCHAR(50) NOT NULL } と CREATE TABLE Address { ID INT PRIMARY

    0

    1答えて

    oracleデータベースの一部の表のデータを取得するための問合せがあります。 私が最後に必要とするのは、重複していないすべてのデータを取得することです。これを達成するために、同じFOLIO、TARJETA、CUENTA、およびIMPORTEを持たないすべてのレコードが必要です。 このため、私はDistinctとGroup byを使用しようとしましたが、どこで/どのようにスクリプトで使用すべきかわか

    1

    2答えて

    特定のスキューを持つストア(ストア1〜10)の個数を数えようとしています。ここに私のコードは次のとおりです。 SELECT distinct COUNT(*) as total_store FROM( select distinct st.* from (select st.* from store_table st )st WHERE st.store b

    0

    3答えて

    MS Access DBでは、クライアントの到着日と出発日に関する情報があります。これに基づいて、週に訪問するクライアントの数を計算したいと思います。 次の例を考えてみましょう。ピーターは1月の第1週に到着し、第3週に休みます(週は日曜日に始まります)。一方、メアリーは最初の週に到着し、葉。 Iは最初の列の週番号と第二におけるゲストの合計数と、以下に示すように出力になりたいです。 このくださいを達

    1

    1答えて

    に複数の機能を集約を実行する私は、次のデータフレームがあります、しかし df2 = df.groupby(pd.TimeGrouper(freq='M')) df2 = df.agg({'total_in': 'sum', 'total_out': 'sum', 'balance': 'last'}) : date in out balance 01/01/2017 50 70 10