距離の2次元配列が与えられた場合、argsortを使用してインデックス配列を生成します。最初の要素は行の最小値のインデックスです。索引付けを使用して最初のK列のみを選択します。ここではK = 3です。私は、やりたい何行ごとにリセットされるN個の値の小さい位置のマスク配列を生成する
position = np.random.randint(100, size=(5, 5))
array([[36, 63, 3, 78, 98],
[75, 86, 63, 61, 79],
[21, 12, 72, 27, 23],
[38, 16, 17, 88, 29],
[93, 37, 48, 88, 10]])
idx = position.argsort()
array([[2, 0, 1, 3, 4],
[3, 2, 0, 4, 1],
[1, 0, 4, 3, 2],
[1, 2, 4, 0, 3],
[4, 1, 2, 3, 0]])
idx[:,0:3]
array([[2, 0, 1],
[3, 2, 0],
[1, 0, 4],
[1, 2, 4],
[4, 1, 2]])
は元の位置のアレイに適用した場合のkの最短距離をもたらすだけインデックスを返すマスクされた配列を作成します。
私はこのアプローチを1次元配列で動作するコードに基づいています。
# https://glowingpython.blogspot.co.uk/2012/04/k-nearest-neighbor-search.html
from numpy import random, argsort, sqrt
from matplotlib import pyplot as plt
def knn_search(x, D, K):
""" find K nearest neighbours of data among D """
ndata = D.shape[1]
K = K if K < ndata else ndata
# euclidean distances from the other points
sqd = sqrt(((D - x[:, :ndata]) ** 2).sum(axis=0))
idx = argsort(sqd) # sorting
# return the indexes of K nearest neighbours
return idx[:K]
# knn_search test
data = random.rand(2, 5) # random dataset
x = random.rand(2, 1) # query point
# performing the search
neig_idx = knn_search(x, data, 2)
figure = plt.figure()
plt.scatter(data[0,:], data[1,:])
plt.scatter(x[0], x[1], c='g')
plt.scatter(data[0, neig_idx], data[1, neig_idx], c='r', marker = 'o')
plt.show()
-
サンプル入力、偽として行あたりの最低
3
要素を設定する場合の出力その2Dケースの予想出力? – Divakar主にTrue要素を持つマスク配列で、Kの最低値のみが各行でFalseになります。 –