-5
csvファイルをパーケットフォーマットに変換する必要があります。しかし、このcsvファイルは非常に巨大です(65,000行と1,000列以上)。そのため、私の寄木細工のファイルをいくつかのサブファイルに分割する必要があります(それぞれ5 000行と200列)。私はすでにpartition_onとrow_group_offsetsを試しましたが、うまくいきません。ファーストパーケットを使用してサブファイル上のパーケットファイルを分割する
マイコード:
import pandas as pd
import fastparquet as fp
df = pd.read_csv('D:\Users\mim\Desktop\SI\LOG\LOG.csv')
fp.write(r'D:\Users\mim\Desktop\SI\newdata.parq', df)