k-means

    1

    1答えて

    私はdoc2vecを初めて使いました。 私はこの問題について多くの人に尋ねましたが、その解決策は誰にも分かりません。 私がやりたいことは、Doc2vecの結果をk-meansに集約することです。コードの下をご覧ください。 mbk = MiniBatchKMeans(n_clusters=3, init_size=400, batch_size=300, verbose=1).fit(model_d

    0

    1答えて

    このような問題や解決策がたくさんあることは知っていますが、別の方法があると思います。 ゴール:最終的な目標は、画像が与えられた色をクラスタ化し、ユーザーがそれらの色を変更できるようにすることです。ユーザーはkを入力する必要はありません。アルゴリズムはKを決定します。 方法:現在、シルエットスコアメトリック(http://scikit-learn.sourceforge.net/dev/module

    0

    2答えて

    以下のコードを使用しているときに、四角形の合計内で合計が増加しています。これも可能ですか、コードで間違いをしていますか? v<-foreach(i = 1:30,.combine = c) %dopar% { iter <- kmeans (clustering_data,centers = i,iter.max = 1000) iter$tot.withinss }

    -3

    1答えて

    をK平均I持って次の入力整数ベクトル(例): 4 138 233 461 610 621 669 742 814 827 89 138 334 656 697 810 138 138 196 738 659 738 4 461 138 337 756 810 8 138 196 337 468 663 664 756 809 810 彼らはすべての整数値[1から850]を含む、す

    -1

    1答えて

    私は、二分法k平均アルゴリズムがグローバルな最小値に収束するのを助けます。この申し立てを承認する出典や研究論文を見つけることができなかったので、これが正しいかどうかはわかりません。この主張が正しいかどうか誰かに伝えることができますか?

    0

    2答えて

    私は地理情報を含むスパークデータフレームを持っています。 my_df.show(2) ## +----+----+-----------+----------+ ## | x0 | x1 | longitude | latitude | ## +----+----+-----------+----------+ ## | ...| ...| 51.043 | 13.6847 | ##

    -2

    1答えて

    私はクラスターを与えました。どのように私は2つの部分でクラスタを分割することを決定することができます元のクラスタよりも良いですか? 私はk = 2でk-Meanを使用しようとしましたが、もう一度スタックしました..こぼれ落ちたかったり、こぼれたりしていない方が良いですか? 編集:まあ、私はdownvotesを得るいけない...少し説明が疑問を改善するために役立つだろう:D

    3

    1答えて

    私はsklearn(および一般的なPython)の新機能ですが、のクラスタリングを含むいくつかのプロジェクトで作業する必要があります。 k = 4の100サンプル未満のテストデータセットで次のコードを使用すると、クラスタリングは期待通りに行われました。しかしながら、100個を超えるサンプルを使用し始めたとき、6/8重心は、起点(0,0)で繰り返すのように見えます。つまり、クラスタを生成できませんで

    -3

    1答えて

    コード実行に時間がかかるという問題があります。私はコーディングのためにPythonを使用していますし、マシン学習ライブラリとしてscikitを学んでいます。私の問題は、k-Meansの計算に時間がかかることです(基本的に、400クラスタでグループ化するために約3000のデータポイントがあります)。この方法は約250回繰り返される。タイミングに関しては、終了するのに約40分かかります。どのようにそれ

    -1

    1答えて

    私はapache sparkとscalaを初めて使っています。 私はkを書くことによって練習しようとしていました。 このデータはインターネット上で実践されています。 しかし、私はこれで何をするかを理解できません。 私はk-meansがクラスタリングアルゴリズムであることを知っていますが、このデータセットにこれをどのように適用するのか分かりません。このデータへ ください連中kは、意味私は、この問題文