0
MapReduce
HadoopのRecord
の定義をText以外のデータ型について理解したいと思います。Hadoopのさまざまなタイプのデータセットに対するMapReduceのレコード定義ですか?
通常、Text
の場合、レコードは新しい行でフルラインで終了します。
XMLデータを処理したい場合、このデータはどのように処理されますか、つまりRecord
の定義にはどのようにしてmapper
が機能しますか?
私はInputFormat
とRecordReader
のコンセプトがあると読んだが、うまくいきませんでした。
は、誰も私が(テキスト以外)のデータ・セットの様々なタイプのInputFormat
、RecordReader
との関係が何であるかを理解するのに役立ちますし、どのようにデータがmapper
作品時にどのRecords
に変換されるのでしょうか?詳細は