dataframe

    0

    1答えて

    私はさまざまな国のブロードバンドデータのデータフレームを持っています(たとえば、AT_dfを取る)。 「ofWithTV」および「ofWithFT」の列は文字型であり、それぞれのケース(ブロードバンドオファー)にバンドルされたTVアクセスまたは固定テレフォニーアクセスが付属しているかどうかを示します。私はそのような場合は、両方のイベントは、イベントが「はい」とされている「いいえ」、「テレビDoub

    1

    2答えて

    私は2つの列を持つパンダデータフレームを持っています。 minとmaxという3番目と4番目の列を作りたいと思います。これらの列のそれぞれは、ローカルminまたはmaxがある場合を除いて、nanで満たされ、その極値の値を持ちます。 ここでは、データがどのように見えるかのサンプルを示します。本質的には、図のすべてのピークと低い点を特定しようとしています。 これを達成することができますパンダとツールに組

    0

    1答えて

    以下は私のデータフレームです。 name m d1 d2 d3 d4 d5 name1 m1 45 18 69 35 20 name2 m2 34 19 16 25 0 name3 m3 18 38 0 66 29 name4 m4 52 9 58 84 0 name5 m5 45 75 76 65 79 私は以下のような結果を得たいと思います。基本的には、最後の列に0があるかどうか

    0

    2答えて

    以下は私のデータフレームです。行名と列名があります。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 row1 0 0 0 1 0 0 1 0 0 0 0 0 0 0 0 row2 0 0 0 1 1 1 1 1 1 1 1 1 1 1 0 Iは、各行の列の両端の最後の列から連続するゼロ(、に基づいてカラム試験を導出したい。以下は一例である。最初の

    0

    1答えて

    以下のパイプライン化されたRDDをデータフレームに変換しようとしています。 パイプラインRDD - > user_rdd ['new_user1', 'new_user2', 'Onlyknows', 'Icetea', '_coldcoffee_'] 私は、私は次のエラーを取得しています以下のコード schema = StructType([StructField('Username

    2

    1答えて

    私は大きなレベルのデータセットの方が速いと思われるので、マルチレベルインデックス作成のデータフレームの代わりにパネルを使用しています。しかし、私は今、Midxフレームワークに移行しています。パネルでは、私は簡単にこれを行うことができます:これはエラーを返します cols = [['p1','p2','p3'],['a','b']] idx = pd.MultiIndex.from_product

    3

    4答えて

    私は前に出会ったことのないユースケースを持っています。私は以下のデータフレームを持ち、条件 "i"の各レベルに対して "x"が最小値と最大値をそれぞれ達成する "y"の値を選択したいと思う。正しいですが、私が代わりにその x Minまたは Maxある yを持っているしたいと思います > library(dplyr) > df <- data.frame(i=c(1,1,2,2),x=c(1.0,

    0

    1答えて

    私は8列と10,000行を含むデータフレームを持っています。私はランダムに(例えば1A 2Aとの)値がTRUEある「1」と「2」の列のすべての組み合わせのための3行をサンプリングしたい 私の最初の試みは、次のような次のとおりです。 df[sample(nrow(df[df$1a == TRUE & df$2a == TRUE,]), 3), ] 出力を与えます。 1a 1b 1c 1d 2a 2

    1

    1答えて

    時系列の特定の部分を返すようにDataFrameをスライスしようとしています。しかし、時間は私に問題を与えている週によって刻印されています。 df Week one two 0 12/3/2017 0 7 1 12/3/2017 6 1 2 12/10/2017 5 8 3 12/10/2017 2 4 4 12/17/2017 3 7 5 12/17/2017 2 0

    0

    1答えて

    マイナスの値と、データフレームのすべての列の値が(999,9991,9992,9996)の値を-100に置き換えたい場合は、私がやる。私は同じデータフレームではなく新しいデータフレームとして保存したい。私のデータセットの 私は列の数百 x<-c(-1,-2,0,1,9991) y<-c(1,2,3,4,999) z<-c(100,101,-999,9992,9996) data<-as.da