Flink Streamingを使用してタイムウィンドウストリーム内のユニークワードの数を数える方法はありますか?私はthis質問を参照してくださいが、私は時間ウィンドウを実装する方法を知らない。Flinkでタイムウィンドウストリーム内のユニークワードを数えるには?
0
A
答えて
0
もちろん、それはかなり簡単です。各タイムウィンドウの間にすべての入力レコードに集約が必要な場合は、windowAll()のフレーバーの1つを使用する必要があります。つまり、キーストリームを使用せず、並行して操作することはできません。
tumbling windowsまたはsliding windowsを入力し、event time or processing timeで操作するかどうかを決定する必要があります。
しかし、大まかに言えば、あなたはこのような何かやる:あなたのUniqueWordCounterは、ウィンドウ内のすべての単語の反復可能なを受け、ユニークな単語の数を返しますWindowFunctionなります
StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
env.addSource(...)
.timeWindowAll(Time.minutes(15))
.apply(new UniqueWordCounter())
.print()
env.execute()
を。一方
、あなたがkeyedstreamを使用し、各キーのユニークワードをカウントしたい、それに応じてアプリケーションを変更している場合:
StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
env.addSource(...)
.keyBy(...)
.timeWindow(Time.minutes(15))
.apply(new UniqueWordCounter())
.print()
env.execute()
関連する問題
- 1. テキストファイル内のユニークワード
- 2. t-sqlはテキスト列内のユニークワード数をカウントします
- 3. ユニークワード
- 4. データフレーム内のすべてのユニークワードを取得する方法は?
- 5. Flink 1.xのEventTimeSourceFunction(Flink 0.10.x)の置き換えは何ですか?
- 6. Flinkのグローバル変数
- 7. フォルダ内のリソースを数えるには
- 8. ウィンドウメッセージキュー内のメッセージを数えるには?
- 9. ヘッダーファイル内のオブジェクトを数えるには?
- 10. Flink - jobmanager.rpc.addressの複数のジョブマネージャ
- 11. ハイブの各単語のユニークワード数を取得
- 12. Rubyで配列内の配列数を数えるには?
- 13. FLINKは
- 14. flink環境でflinkジョブのスプリングリソースを初期化する方法
- 15. Pythonは文字列のユニークワードの複数の位置を出力しません
- 16. JSONファイルの配列内のオブジェクトの数を数えるには?
- 17. ApacheのFLINKは、[]カフカ
- 18. ORACLE - コレクション内のメンバーの出現回数を数えるには?
- 19. タグ内の子供の発生数を数えるには?
- 20. 文字列内のシーケンスの出現数を数えるには?
- 21. テンプレート内のmanytomanyの数を数えるには?
- 22. Apache Flinkでのグローバルソート
- 23. FlinkのWindowedStreamにカスタム関数を適用できません。
- 24. 標準でディレクトリ内のファイル数を数える方法は?
- 25. flink:ウィンドウストリームに複数の集約を適用する
- 26. 行列内の偶数を数える
- 27. HTMLファイル内のセクション数を数える
- 28. データの損失/複製を最小限に抑えるためにFlinkシャットダウンフック
- 29. Apache Flink:ローカルモードの複数のタスクマネージャ
- 30. IDEからFlinkを実行しているときにFlinkジョブマネージャのWebインターフェイスを開始するには
をしかしproblemeがある:私は知っている必要があり、各キーの 固有の値であるため、「keyBy」を使用する必要があります – FlinkNoob
このケースも含めて回答を更新しました –
適用はあまりにも一般的です。適用しないとできない方法はありませんか? – FlinkNoob