split-apply-combine

    1

    1答えて

    (終了/開始)^(1 /年数)-1として定義されたCAGR値を計算しようとしています。 私は、 "Stock"、 "date"、 "Annual.Growth.Rate"という列を持つdfを持っています。すぐにメモするには:私はラグ関数を使ってこれをしようとしていましたが、各株式の冒頭で再帰式を変更することはできませんでした。 structure(list(Stock = structure(c(

    0

    1答えて

    私のデータセットには、productタイプのカラムとpurchaseのカラムが含まれています。それぞれのpurchaseからの平均値をそれぞれproductタイプから減算したいと考えています。 私は次のように大体この library(dplyr) set.seed(42) product <- paste("prod - " , sample(c("A", "B", "C", "D"), si

    -1

    1答えて

    スプリット・アプライ・コンバインを行って各メンバーの合計数を求めています。私が必要とするデータフレームには、12列のMemberID, DSFS_0_1, DSFS_1_2, DSFS_2_3, DSFS_3_4, DSFS_4_5, DSFS_5_6, DSFS_6_7, DSFS_7_8, DSFS_8_9, DSFS_9_10, DSFS_10_11, DSFS_11_12, DrugCou

    2

    1答えて

    ように、コードの構築を記述する方法私はプログラミングとのpythonに新しいですと「DEF」「リターン」の建設を使用した機能として、次のコードを書きたいと思います: df.loc[df['DATE_INT'].shift(-1) - df['DATE_INT'] == 1, 'CONSECUTIVE_DAY'] = True df.loc[(df['DATE_INT'].shift(-1) -

    1

    2答えて

    データフレーム内で、私は系列データを含む列に分割適用結合を試みています。 (私はSO検索したが、データフレーム内で直列に関係するものを見つけていません。) データフレーム: import pandas as pd from pandas import Series, DataFrame import numpy as np ex = {'account': [1, 1, 1, 2, 2]

    0

    1答えて

    リストのリストを処理したいと思います。具体的には、各リストの3番目のメンバーであるデータフレームをグループ化変数(各リストの最初のメンバー)で抽出し、mean()、median()、sd()、length()などのいくつかの関数を使用したいそのグループ内のデータだから私の質問はあり Grp mean sd ... a 5.26 ... ... b 6.25 ... ... #fake da

    2

    3答えて

    各番号に最も一般的な文字が必要です。私は様々なことを試みました。何が正しいのか分かりません。 import pandas as pd from pandas import DataFrame, Series original = DataFrame({ 'letter': {0: 'A', 1: 'A', 2: 'A', 3: 'B', 4: 'B'}, 'number'

    3

    1答えて

    最近、因子の相互作用に基づいていくつかのデータをグラフ化しなければならなかったが、私はこれがRにあるべきであると感じるよりも困難であることが分かった。私は30の数のベクトルと1組の要素を持っているとしましょう。 n <- runif(30, min=0, max=10) a <- gl(2, 1, 30) b <- gl(6, 2, 30) そして、それぞれの要素の組み合わせごとに平均が必

    3

    2答えて

    私はGroupByの周りを回っていますが、まだ助けが必要です。私はオブジェクトのグループ番号、いくつかのパラメータRと球座標RAとDecを与えて、Groupという列のDataFrameを持っているとしましょう。私は(Rが負であるため、又は最大絶対値)が最小Rと、ワン、すなわち、各グループは、「明るい」オブジェクトを含む内蔵選択したい df = pd.DataFrame({ 'R' : (

    0

    2答えて

    私は多くのグループに多くの個人(IDを持つ)を持つdata.tableを持っています。各グループ内では、すべてのIDの組み合わせ(すべての個人のペア)を検索したいと思います。私はsplit-apply-combineアプローチでこれを行う方法を知っていますが、私はdata.tableがより速くなることを望んでいます。 サンプルデータ: dat <- data.table(ids=1:20, gro