split-apply-combine

1熱

1答えて

（終了/開始）^（1 /年数）-1として定義されたCAGR値を計算しようとしています。私は、 "Stock"、 "date"、 "Annual.Growth.Rate"という列を持つdfを持っています。すぐにメモするには：私はラグ関数を使ってこれをしようとしていましたが、各株式の冒頭で再帰式を変更することはできませんでした。 structure(list(Stock = structure(c(

0熱

1答えて

R - 条件付きIF - 各行のマッチング条件

私のデータセットには、productタイプのカラムとpurchaseのカラムが含まれています。それぞれのpurchaseからの平均値をそれぞれproductタイプから減算したいと考えています。私は次のように大体この library(dplyr) set.seed(42) product <- paste("prod - " , sample(c("A", "B", "C", "D"), si

-1熱

1答えて

パンダのスプリット・アプライ・コンビでは省略された列

スプリット・アプライ・コンバインを行って各メンバーの合計数を求めています。私が必要とするデータフレームには、12列のMemberID, DSFS_0_1, DSFS_1_2, DSFS_2_3, DSFS_3_4, DSFS_4_5, DSFS_5_6, DSFS_6_7, DSFS_7_8, DSFS_8_9, DSFS_9_10, DSFS_10_11, DSFS_11_12, DrugCou

2熱

1答えて

どのように機能

ように、コードの構築を記述する方法私はプログラミングとのpythonに新しいですと「DEF」「リターン」の建設を使用した機能として、次のコードを書きたいと思います： df.loc[df['DATE_INT'].shift(-1) - df['DATE_INT'] == 1, 'CONSECUTIVE_DAY'] = True df.loc[(df['DATE_INT'].shift(-1) -

1熱

2答えて

DataFrame内のPython Pandas集計シリーズデータ

データフレーム内で、私は系列データを含む列に分割適用結合を試みています。（私はSO検索したが、データフレーム内で直列に関係するものを見つけていません。）データフレーム： import pandas as pd from pandas import Series, DataFrame import numpy as np ex = {'account': [1, 1, 1, 2, 2]

0熱

1答えて

グループ別リストの処理

リストのリストを処理したいと思います。具体的には、各リストの3番目のメンバーであるデータフレームをグループ化変数（各リストの最初のメンバー）で抽出し、mean（）、median（）、sd（）、length（）などのいくつかの関数を使用したいそのグループ内のデータだから私の質問はあり Grp mean sd ... a 5.26 ... ... b 6.25 ... ... #fake da

2熱

3答えて

各列の値に最も一般的な列を取得します。

各番号に最も一般的な文字が必要です。私は様々なことを試みました。何が正しいのか分かりません。 import pandas as pd from pandas import DataFrame, Series original = DataFrame({ 'letter': {0: 'A', 1: 'A', 2: 'A', 3: 'B', 4: 'B'}, 'number'

3熱

1答えて

ファクタインタラクションを分離する方法

最近、因子の相互作用に基づいていくつかのデータをグラフ化しなければならなかったが、私はこれがRにあるべきであると感じるよりも困難であることが分かった。私は30の数のベクトルと1組の要素を持っているとしましょう。 n <- runif(30, min=0, max=10) a <- gl(2, 1, 30) b <- gl(6, 2, 30) そして、それぞれの要素の組み合わせごとに平均が必

3熱

2答えて

Pandas DataFrameで複雑なサブセットを構築する

私はGroupByの周りを回っていますが、まだ助けが必要です。私はオブジェクトのグループ番号、いくつかのパラメータRと球座標RAとDecを与えて、Groupという列のDataFrameを持っているとしましょう。私は（Rが負であるため、又は最大絶対値）が最小Rと、ワン、すなわち、各グループは、「明るい」オブジェクトを含む内蔵選択したい df = pd.DataFrame({ 'R' : (

0熱

2答えて

すべてのIDペアを生成するgroup by data.table in R

私は多くのグループに多くの個人（IDを持つ）を持つdata.tableを持っています。各グループ内では、すべてのIDの組み合わせ（すべての個人のペア）を検索したいと思います。私はsplit-apply-combineアプローチでこれを行う方法を知っていますが、私はdata.tableがより速くなることを望んでいます。サンプルデータ： dat <- data.table(ids=1:20, gro