私は時系列データを持っています。Python - 概要日付と名前を使用した統計
1)それぞれの名前の場合:私は、このデータセット上のいくつかの要約データ解析を行う必要があり、A、B、C、Dの
:データのキーは、日付や名前であり、データは4つの属性を持っています各名前についてA、B、C及びDの平均
2)、各名についてA、B、C、及びD
3)の標準偏差は、合計の割合としてのNaNの数を数えますA、B、C、Dのそれぞれについて
私はRに精通していますが、pythonには慣れていません。あなたが正しい方向に私を向けることができれば、それ以上のものになるでしょう!ありがとうございました。
asof_dt = pd.date_range('20151231','20160130')
df1=pd.DataFrame(np.random.randn(len(asof_dt),4),index=asof_dt,columns=('A','B','C','D'))
df1['name']='alpha'
df2=pd.DataFrame(np.random.randn(len(asof_dt),4),index=asof_dt,columns=('A','B','C','D'))
df2['name']='beta'
df3=pd.DataFrame(np.random.randn(len(asof_dt),4),index=asof_dt,columns=('A','B','C','D'))
df3['name']='gama'
df_total = pd.concat([df1,df2,df3])
df_total[['name','A','B','C']]
は、すべてのもののように思えます"groupBy"を小文字の "groupby"に変更すると動作します。しかし、最後のものは動作しません: AttributeError: 'DataFrameGroupBy'オブジェクトの呼び出し可能な属性 'isnull'にアクセスできない、 'apply'メソッドを試してください –
@TrexionKameha:これは、まずそれを実行せずにコードを投稿するためのものです: )。 'pandas.isnull'関数で' apply'を使うと、同じ効果を得ることができます。editを参照してください。 – spiffman
%NaNを取得するには、 'count'によって提供された非NULL値の数ではなく、総数(長さ)で除算する必要があります。 – Alexander