2017-08-04 6 views
0

ファイルは.tarファイルにあります。## tarファイルからメンバーを抽出できます。また、tikaパーサーを使ってpdfファイルを解析しています。受信ファイルが見つかりませんでした。PDFを読むにはpythonを使って.tarファイルに入っています

with tarfile.open(os.path.join(DEFAULT_PATH,filename), "r") as tarf: 
    for members in tarf.getmembers(): 
     f = tarf.extractfile(members) 
     parsed_pdf = parser.from_file(f) 

と私は別のディレクトリにPDFファイルを抽出し、ちょうどコードの下に使用することにより、上記の解決

答えて

0

エイブル.tarファイルから読み込みたいいけない

 for members in tarf.getnames()[1:]: 

      tarf.extract(members, './full_text') 
      parsed_pdf = parser.from_file(os.path.join(DEFAULT_PATH,filename)) 
関連する問題