私は、ハミング距離を得るためにそれらの間の距離を得るために必要なバイナリnumpy配列を持っています。最も近い方法は、私が得る最も速い方法は、距離を持つfloat行列を返すことです。最適化ハミング距離Python
私はこのような時にそれを一つの要素をやっているので、私は1Mx1Mフロート行列を得るために十分なメモリを持っていないので:
from scipy.spatial Import distance
Hamming_Distance = distance.cdist(array1,all_array,'hamming')
problesはそれがために2-3sのように撮影したということですそれぞれのHamming_Distanceを1mのドキュメントにすると永遠になりました(そして私はそれを別のkに使う必要があります)。
最速の方法はありますか?
私はマルチプロセッシングについて考えていますが、それをCで作っていますが、Python上でマルチプロセッシングがどのように動作するのかを理解していて、CコードとPythonコードをどのように混ぜるべきか分かりません。
あなたはブルートフォースのリソースの近くにいない問題をブルートフォースしようとしています。すべてのペア間の距離を計算し、低いものを取るよりも、最も近い近隣を見つけるより良い方法があります。 – user2357112