pandas

    2

    2答えて

    私は次の形式でパンダのデータフレームを持つ列をまとめる: d = {'buyer_code': ['A', 'B', 'C', 'A', 'A', 'B', 'B', 'A', 'C'], 'dollar_amount': ['2240.000', '160.000', '300.000', '10920.000', '10920.000', '235.749', '275.000', '1092

    0

    1答えて

    私は、いくつかの奇妙な出力ファイルが、pandasとPyPDF2を使用していくつかのPDFファイルをマージしようとしています。 私は単一のページを持っています。PDF(証明書)すべてに共通する2ページのドキュメントとマージする必要があります。そして、起源ファイルに名前を付けられた人のために出力ファイルに名前を付けます。私はそれを自動化したいという妥当な数があるので 私はPythonに堪能ではありま

    -1

    1答えて

    私は列から値を取得し、それらの項目の日付列と番号列が一致している場合にのみそれらを連結したいpandasデータフレームを持っています。ここでは、出力は私がこの操作は上が起こるしたいほぼ172355行をしました。この No. Date Code Output 121 1-Jul-15 AT AT 122 2-Jul-17 PN PN/WX 122 2-Jul-17 WX PN/WX 122

    2

    1答えて

    すでにグループ化されたインデックスリストをdataframeとし、サブデータフレームをgroupbyまたは他の関数を使用して取得したいとします。私はisinのような[df[df.index.isin(group)] for group in grouplist]を使用してデータフレームを何回も照会することができますが、それは非常に遅いようです。どのようにグループをより効率的にすることができますか?

    -1

    1答えて

    私が移調したいデータフレームがあります。私は何をしたいか import pandas as pd sid= '13HKQ0Ue1_YCP-pKUxFuqdiqgmW_AZeR7P3VsUwrCnZo' # spreadsheet id gid = 0 # sheet unique id (0 equals sheet0) url = 'https://docs.google.com/spr

    2

    3答えて

    私はある列の特定の単語(テスト)でフィルタリングしたいパンダのデータフレームを持っています。私が試した: df[df[col].str.contains('test')] しかし、それは単なる列名で空のデータフレームを返します。出力のために、私は 'test'という単語を含むすべての行を含むデータフレームを探しています。私に何ができる? EDIT(サンプルを追加する): data = pd.rea

    1

    1答えて

    Striker_Idでグループ化された2つの列とグループ化された 'Striker_Id'に対応する 'Batsman_Scored'の合計を持つ他の列を作成する、 例: Striker_ID Batsman_Scored 1 0 2 8 ... 私はこのball.groupby(['Striker_Id'])['Batsman_Scored'].sum()を試みたが、これは私が

    0

    1答えて

    私はpandas read_csvの問題に直面しています。私は実際には、それはケースではありません。フィールド値として「含まれているファイルを、持っているが、これに私は回避策を見つけなければならないため、私は、ファイルの生成に影響を及ぼさない。 pandas.errors.ParserError: Error tokenizing data. C error: EOF inside string

    1

    2答えて

    私は2つの列を持つパンダデータフレームを持っています。 minとmaxという3番目と4番目の列を作りたいと思います。これらの列のそれぞれは、ローカルminまたはmaxがある場合を除いて、nanで満たされ、その極値の値を持ちます。 ここでは、データがどのように見えるかのサンプルを示します。本質的には、図のすべてのピークと低い点を特定しようとしています。 これを達成することができますパンダとツールに組

    2

    1答えて

    私は大きなレベルのデータセットの方が速いと思われるので、マルチレベルインデックス作成のデータフレームの代わりにパネルを使用しています。しかし、私は今、Midxフレームワークに移行しています。パネルでは、私は簡単にこれを行うことができます:これはエラーを返します cols = [['p1','p2','p3'],['a','b']] idx = pd.MultiIndex.from_product