HDFSからスナップファイルを解読する際に問題が発生しています。 hadoop fs -text
を使用すると、ファイルを解凍して出力することができます。私はハドープスナップファイルの復号化
snappy.UncompressError: Error while decompressing: invalid input
を取得hadoop fs -copyToLocal
を使用してのpython-てきぱきとファイルを解凍しようとした場合しかし、私のPythonプログラムは非常に簡単で、次のようになります。
import snappy
with open (snappy_file, "r") as input_file:
data = input_file.read()
uncompressed = snappy.uncompress(data)
print uncompressed
これは私のために無残に失敗しました。だから私は別のテキストを試して、私はhadoop fs -text
からの出力を取り出し、python - スナッピーライブラリを使用してそれを圧縮した。私はそれをファイルに出力しました。私はこのファイルを読み込んで解凍できました。
AFAIKスナップショットはバージョン間で下位互換性があります。私のpythonコードは最新のスナップバージョンを使用しています。私はhadoopが古いスナッピングバージョンを使用していると推測しています。これが問題なのでしょうか?それとも私がここで紛失している何か他にありますか?