pandas

2熱

2答えて

私は次の形式でパンダのデータフレームを持つ列をまとめる： d = {'buyer_code': ['A', 'B', 'C', 'A', 'A', 'B', 'B', 'A', 'C'], 'dollar_amount': ['2240.000', '160.000', '300.000', '10920.000', '10920.000', '235.749', '275.000', '1092

0熱

1答えて

ファイルリストからのPyPDF2マージ問題

私は、いくつかの奇妙な出力ファイルが、pandasとPyPDF2を使用していくつかのPDFファイルをマージしようとしています。私は単一のページを持っています。PDF（証明書）すべてに共通する2ページのドキュメントとマージする必要があります。そして、起源ファイルに名前を付けられた人のために出力ファイルに名前を付けます。私はそれを自動化したいという妥当な数があるので私はPythonに堪能ではありま

-1熱

1答えて

Pandas-Pythonでの連結

私は列から値を取得し、それらの項目の日付列と番号列が一致している場合にのみそれらを連結したいpandasデータフレームを持っています。ここでは、出力は私がこの操作は上が起こるしたいほぼ172355行をしました。この No. Date Code Output 121 1-Jul-15 AT AT 122 2-Jul-17 PN PN/WX 122 2-Jul-17 WX PN/WX 122

2熱

1答えて

pandasグループをグループインディスのリストで

すでにグループ化されたインデックスリストをdataframeとし、サブデータフレームをgroupbyまたは他の関数を使用して取得したいとします。私はisinのような[df[df.index.isin(group)] for group in grouplist]を使用してデータフレームを何回も照会することができますが、それは非常に遅いようです。どのようにグループをより効率的にすることができますか？

-1熱

1答えて

PythonのパンダGROUPBY、行の値

私が移調したいデータフレームがあります。私は何をしたいか import pandas as pd sid= '13HKQ0Ue1_YCP-pKUxFuqdiqgmW_AZeR7P3VsUwrCnZo' # spreadsheet id gid = 0 # sheet unique id (0 equals sheet0) url = 'https://docs.google.com/spr

2熱

3答えて

パンダのデータフレームを文字列でフィルタリングする方法は？

私はある列の特定の単語（テスト）でフィルタリングしたいパンダのデータフレームを持っています。私が試した： df[df[col].str.contains('test')] しかし、それは単なる列名で空のデータフレームを返します。出力のために、私は 'test'という単語を含むすべての行を含むデータフレームを探しています。私に何ができる？ EDIT（サンプルを追加する）： data = pd.rea

1熱

1答えて

Pythonデータフレームを1列分グループ化して他の列の合計を得る方法

Striker_Idでグループ化された2つの列とグループ化された 'Striker_Id'に対応する 'Batsman_Scored'の合計を持つ他の列を作成する、例： Striker_ID Batsman_Scored 1 0 2 8 ... 私はこのball.groupby(['Striker_Id'])['Batsman_Scored'].sum()を試みたが、これは私が

0熱

1答えて

パンダread_csv行内の文字列内のEOF

私はpandas read_csvの問題に直面しています。私は実際には、それはケースではありません。フィールド値として「含まれているファイルを、持っているが、これに私は回避策を見つけなければならないため、私は、ファイルの生成に影響を及ぼさない。 pandas.errors.ParserError: Error tokenizing data. C error: EOF inside string

1熱

2答えて

パンダがローカル最大値と最小値を見つける

私は2つの列を持つパンダデータフレームを持っています。 minとmaxという3番目と4番目の列を作りたいと思います。これらの列のそれぞれは、ローカルminまたはmaxがある場合を除いて、nanで満たされ、その極値の値を持ちます。ここでは、データがどのように見えるかのサンプルを示します。本質的には、図のすべてのピークと低い点を特定しようとしています。これを達成することができますパンダとツールに組

2熱

1答えて

python pandasマルチレベルインデックス作成 - 新しい列の追加

私は大きなレベルのデータセットの方が速いと思われるので、マルチレベルインデックス作成のデータフレームの代わりにパネルを使用しています。しかし、私は今、Midxフレームワークに移行しています。パネルでは、私は簡単にこれを行うことができます：これはエラーを返します cols = [['p1','p2','p3'],['a','b']] idx = pd.MultiIndex.from_product