私は今まで米国で起こった竜巻にある巨大なデータを分析しなければならない1つのプロジェクトを行っています。 Pythonがデータ解析に適しているので、私はそれを選択しました。しかし、私は明確化が必要ないくつかの質問があります: 1.私はデータ分析のためにパンダを使用しています。私が今まで行ったことは、すべての.csvファイルを含む1つの大きなデータフレーム(1GBの.csvファイル)を作成したことです。さて、私は2000年に起こった死亡者の総数を計算したいと考えてみましょう。クエリは結果を取得していますが、時間がかかります。すべてのデータをデータフレームに格納し、データをフェッチするとよいですか?あるいは、他のより速いアプローチがありますか? 2.別のアプローチは、ファイル全体のjson文字列を作成し、そのjson文字列を照会します。私はこのアプローチで何もしていない。いいですか?データを取得してPythonで解析するアプローチ
ありがとうございます。