2016-08-21 6 views
0

ここの初心者です。私はウェブサイトからいくつかの情報を拾い読みするスクリプトをまとめました。これは毎日行われ、データはcsvファイルに保存されます。各ファイルの内容は次のようになります。python - スクレイプされたデータを解析するときの最善のアプローチ

date, ticker, company name, momentum indicator, other ratios.... 
2016-08-19, GSK, GlaxoSmithKline, 42, .... 
2016-08-19, RDSB, Royal Dutch Shell, 98, ..... 
.... 

私は毎日のデータを3ヶ月分蓄積していますので、約80ファイルです。 (ファイル内のすべての行は同じ日付で、次に異なるシェアを持ちます)。 私が今やってみたいのは、シェアメントインジケータと他の比率の進化をシェアごとにチェックすることです。

は、例えば、私は、このような今

GSK_momentum_indicator = (42, 43, 38, 47,...) 
RDSB_momentum_indicator = (98, 91, 77, 79,...) 

など一連のリストで終わるべきだと思い、初心者として、私は2つの質問を持っている: 1)あなたがのために最善のアプローチは何だと思いますこの?それはリスト、辞書、何かを使用していますか? 2)あなたは上記を決めましたか?使用する戦略のガイドラインはありますか?私はこのテーマについてもっと学ぶための初心者として読むことができる良いリソースがありますか?

ありがとうございました!

PS。違いがある場合は、Python 3.5.2を使用しています。

+1

['pandas'](http://pandas.pydata.org)をご覧ください。 – MattDMo

+0

はい。パンダは確かにその方向性です。私はあなたにアップフォートをくれました。しかし、いつか私はそのような質問にどのように答えているのか、いつも混乱しているだけです。 「パンダをチェックアウト」したまま、他人が大げさに投票します... – stanleyxu2005

答えて

1

収集したデータを処理するには、Pythonモジュールの1つ、csvまたはpandasを使用できます。 csvモジュールは、CSVファイルの読み書きに使用され、データをPythonのリストや辞書に変換して使用することができます。詳細なドキュメントについてはhereをご覧ください。

しかし、大きなデータセットをお持ちの場合は、pandasのデータ分析専用ツールをご利用ください。 pandas.read_csv関数は、引数としてcsvファイルの名前をとり、さまざまな操作を実行できるDataFrameオブジェクトを返します。詳細なドキュメントについてはhereをご覧ください。

関連する問題