2016-10-19 4 views
2

私はsklearn.metrics.pairwise.cosine_similarityで余弦行列を計算しようとしています。出力マトリックスは60k * 50kかもしれません。ただし、32GメモリのMemoryErrorを返します。サーバーにメモリを追加することを検討していますが、どれだけ必要なのかを見積もりたいと思います。cosine_similarity行列に必要なメモリを見積もる方法は?

ありがとうございました。

+0

64ビットのPythonを使用していますか? (32ビットのPythonはメモリエラーの一般的な原因です) – maxymoo

答えて

1

必要なメモリの見積もりは、60,000 * 50,000 * 4バイト= 12ギガバイトです。浮動小数点の代わりに倍精度を使用している場合は、メモリの2倍の容量になります。

+0

浮動小数点ハッシュ(量子化)を行うことはできますが、それは損失があります:http://oldweb.mit.bme.hu/books/quantization/floating-point.pdf 。 Pythonで:https://docs.python.org/3/library/decimal.html#decimal.Decimal.quantize – alvas

関連する問題