私はデータストアに中間作業を格納する大規模なパイプラインをGoogleアプリケーションエンジンに持っています。これは私の毎日のクォータの書き込みをすぐに満たします。memcacheに保存されているdbハッシュテーブルをcronジョブと組み合わせてGoogleアプリケーションエンジンに書き込むDatastore
代わりに、パイプラインがすべての中間結果を格納し、ハッシュテーブルdbのすべてのエントリをループしてデータストアに書き込むcronジョブを持つmemcacheに格納されているハッシュテーブルdbオブジェクトを考えています。私はその後、私のデータを読み込むためにdbオブジェクトを使用し、そこに何かがなければ私はデータストアに行くでしょう。
これを行うライブラリはありますか?私は主にJavaに興味がありますが、Pythonも機能します。間違っているかもしれないことの考えはありますか?私は物事がmemcacheから一掃されるかもしれないことを知っていますが、期待されるパフォーマンスの向上はどうでしょうか?
主な考え方は、memcacheが保証されておらず、予測できないことです。キャッシュされたままのデータを管理することはできません。あなたはおそらくメモリ上で作業を行うことで逃げることができますが、キャッシュ内のデータ消失から回復するためには間違いなくフォールバックが必要です。 – Sologoub
一つの明白な点を確認する:検索で使われないすべてのプロパティに対して 'index = False'を宣言しましたか?既定でインデックスされるプロパティは、それぞれ2つのインデックス書き込みを発生させます。それらは合計する。 –