1
Gafblinを使用してHDFSの同じファイルにカフカからの新しいメッセージを追加する方法はありますか?今度は、カフカから読むたびに新しいファイルを作成します。たとえば毎分Gobblinジョブを実行すると、たくさんのファイルになります。Gobblin Kafka to HDFS:同じファイルに追加
助けてください!
Gafblinを使用してHDFSの同じファイルにカフカからの新しいメッセージを追加する方法はありますか?今度は、カフカから読むたびに新しいファイルを作成します。たとえば毎分Gobblinジョブを実行すると、たくさんのファイルになります。Gobblin Kafka to HDFS:同じファイルに追加
助けてください!
Gobblinはよくわかりませんが、IMHO Apache Flumeはあなたにとってより良い選択です。
私が知っているように、Flumeは同じファイルに追加することはできません。 –
1.同じフォルダにファイルを書き込むと、MR/Sparkはフォルダ内のすべてのファイルをフォルダに読み込むことができます。 –
はい、私の要点は何十億ものファイルを作成することではありません。 –