私は初心者の質問と間違いのために、あいにくPythonには新しいです。プロット:単一の大きな列とその頻度
私はそれを自分で見つけようとしましたが、基本情報の一部が失われているように感じます。
目的は、この情報を棒グラフでプロットすることです。
私はpandasデータフレーム、43169行×1列から列を分離しました。例:
user_lifetime
0 947.000000
1 951.000000
2 523.000000
3 741.000000
4 840.000000
5 563.000000
これをプロットするには、それぞれ固有の値の頻度を取得する必要がありますか?
lifetime=df.apply(lambda x: x.value_counts(dropna=False)).
それは私が目指していたものと思われるが、私がプロットするために使用することができ、テーブルとは思われないこと
user_lifetime
15947.000000 4677
15916.000000 1951
2017.000000 1917
2016.000000 1131
2014.000000 445
のようなテーブルを生成します。 はこれを見つけました。
私が逃したものについての提案はありますか? 講義でこれらの例を使用したので、パッケージの最優先順位はggplotです。あなたはしかし、バーのトンで終わるかもしれないチェーンpd.Series.value_countsとplot(kind='bar')
(またはplot.bar()
、バージョン0.17.1の新機能と完全に同等)
df['user_lifetime'].value_counts().plot(kind='bar')
に必要
は、私は、Pythonに非常に慣れていないんだけど、あなたは正しいGEOMを使用する場合ggplotはあなたのためのカウントを行います。 – Axeman