read_csv
を使用して、ファイルの最初のn
行だけを読み込む方法がありますか?私は読んで長い時間がかかる大きなファイルを持っていて、たまには最初の20行を使ってそのサンプルを取得したいだけです(完全なものを読み込んでその頭部を取ることを好まない)。パンダのデータフレームの最初の数行を読み取る方法
もし私がfooter_lines = total_lines - n
のような何かをして、skipfooter
キーワードargに渡すことができる行の総数を知っていたら。私の現在のソリューションは、手動でパンダにPythonとはStringIOそれで最初n
ラインをつかむためにある:
import pandas as pd
from StringIO import StringIO
n = 20
with open('big_file.csv', 'r') as f:
head = ''.join(f.readlines(n))
df = pd.read_csv(StringIO(head))
それは悪くはないですが、キーワードでそれを行うために、より簡潔な、「pandasic」方法があります(?)か何か?
最後の_N_行のチェックアウトをロードする方法を確認する[このSOの投稿](http://stackoverflow.com/questions/17108250/efficiently-read-last-n-rows-of-csv-into-dataframe) – zelusp
あなたは "パンダスティック"を意味しましたか? :) –