私たちは双方向ストリーミングエンドポイントと単項エンドポイントを持つpythonでgrpcサービスを構築しています。Grpcサーバースケーリング(双方向無限ストリーミング)
タイムアウトがなく、ストリームが期待どおりに動作するようにストリームを永久に保存したい場合は、展開にkubernatesとdockerを使用しています。
しかし、私たちはサービスのスケーリングの問題、無限のストリーミングgrpcサーバの規模をどのように調整するか、いくつかの要求に基づいてスケールすることはできませんが、要求は1つしかなく、フレームとしてデータが送信されます。
このサービスをどのように拡張できますか?今すぐワーカースレッドプール内の最大スレッド数は100です。
1つの簡単な解決策は、CPU負荷とメモリ使用量に基づいて最大ワーカースレッドに高い数値とスケールを与えることです。
これを行うにはより良い方法があります。
@nathanielmanistaatgoogleこれに関するご提案はありますか?これは正しい使用法ですか? – Samarendra