Apache SamzaでローカルシステムまたはHDFSからファイルを読み取る方法をお探しの場合 フィルタを適用し、条件を集計します。 。 何か助けてください。Apache Samzaのファイルをローカルファイルシステムとhdfsシステムから読み取る方法
1
A
答えて
0
使用するデータソースごとにシステムを作成する必要があります。たとえば、ファイルから読み込むには、FileReaderSystemFactoryを使用してシステムを作成し、HDFSの場合はHdfsSystemFactoryを使用してシステムを作成する必要があります。その後、通常のプロセスコールバックやウィンドウ処理を使用してデータを処理することができます。
0
標準のカフカプロデューサーを使用してSamzaジョブをフィードできます。あなたのために簡単にする。あなたが基本的なフィルタリングを行うことができます
- 入力ローカルファイルまたはHDFSなど
- ここフィルター(別売)、集約など
- カフカの出力を持つ:あなたLogstashを使用することができ、あなたが指定したLogstashスクリプトを作成する必要があります特定のトピックあなたは私がローカルファイルからを私samzaジョブを養うために、このアプローチを使用していた
入力
を送りたいです
もう1つのアプローチは、Kafka Connectを使用することです。 http://docs.confluent.io/2.0.0/connect/
関連する問題
- 1. リモートHDFSからファイルを読み取る
- 2. Apache SparkファイルをHDFSからストリームとして読み込みます
- 3. hdfsからファイルを読む方法
- 4. ローカルファイルシステムからHDFSに自動的にzipファイルをコピーする方法
- 5. JAVAを使用してHDFSからローカルファイルシステムにファイルをコピーする
- 6. clouderaのローカルファイルシステムからhadoop/hdfsにファイルをコピーできません
- 7. Flumeを使用してローカルファイルシステムからHDFSにファイルをコピー
- 8. node.js内の別のシステムからファイルを読み取る
- 9. Apache MINAでソケットからバイナリデータを読み取る方法は?
- 10. Apache Commons Configuration2 InputStreamからデータを読み取る方法
- 11. Linuxシステムでgolangのxlsファイルから値を読み取る
- 12. HDFSからファイルを読み取ることができません
- 13. プロジェクトとは別のフォルダからファイルを読み取る方法
- 14. 各システムの複数のcrontabファイルから読み取るCron
- 15. Pythonを使用してHDFSディレクトリ内のファイルを読み取る方法
- 16. Linuxサーバーからgeolitecityファイルのパスを読み取る方法は?
- 17. フォーマット済みのデータをファイルから読み取る方法は?
- 18. .CABファイルから_setup.xmlファイルの内容を読み取る方法
- 19. リモートサーバー上のJarファイルからファイルを読み取る方法
- 20. コンボボックスのtxtファイルから平方根を読み取る方法
- 21. PHPファイルからA-Zとa-zのみを読み取る方法
- 22. テキストファイルから読み込むときにApache Ignite Cacheを読み込む方法
- 23. Javaのファイルからランダムな行を読み取る方法
- 24. RのExcelファイルから日付を読み取る方法は?
- 25. パンダのオンラインZIPリンクからファイルを読み取る方法
- 26. ファイルエクスプローラの「開く」オプションからファイルを読み取る方法は?
- 27. 複数のファイルからデータ行を読み取る方法
- 28. Webサーバー上のXMLファイルからデータを読み取る方法
- 29. ファイルから '整数'型のデータを読み取る方法は?
- 30. アンドロイドアプリからjsonファイルの名前を読み取る方法は?