k-means

    2

    1答えて

    def closest_centroid(points, centroids): """returns an array containing the index to the nearest centroid for each point""" distances = np.sqrt(((points - centroids[:, np.newaxis])**2).sum(a

    4

    1答えて

    私は2次元配列として距離行列を持っているが、このように:だから 、私はその助けを借りて、要素のクラスタを、見つける必要があります。私は、k-meansのような階層的クラスタ化を使って、それを行うことができます。私はここでそのような例を見つけましたPHP K-Means この例では、2次元配列をポイントの配列に変換する方法はありますか? $points = [ [80,55],[86,59],[1

    0

    1答えて

    SparkでKMeansクラスタ解析を実行しようとしたのは初めてのことです。愚かな質問をおかけして申し訳ありません。 多くの列を持つスパークデータフレームmydataframeがあります。私は、単純な値として、latとlong(緯度&経度)の2つの列でkmeansを実行したいとします。私はちょうどそれらの2つの列に基づいて7つのクラスターを抽出したいと思います。 from numpy import

    1

    1答えて

    ggplot2を使ってどのようにプロットすればよいか知りたい。 bdata [、c(25:54)]は、遺伝子発現の値を持つデータフレームから30列です。各列は遺伝子です。 cl <- kmeans(t(bdata[,c(25:54)]), 3) plot(t(bdata[,c(25:54)]), col = cl$cluster) points(cl$centers, col = 1:3, p

    1

    3答えて

    私が使用しているデータセットは以下のとおりです。あなたが見ることができるように、k-meansクラスタ分析は、これらのクラスタの中心を容易に見つけると考えるでしょう。しかし 、私はクラスター分析をKが-意味し、私はこれを取得センターをプロットし実行します。 私は基本的な関数kmeansコード使用しています:関数kmeansについてはほとんど知られて事実が信頼性の高い結果を得るために、あなたは多くの

    0

    1答えて

    k-meansアルゴリズムを実行するmap reduceプログラムを作成しようとしています。私はmap reduceを使うのが反復アルゴリズムを実行する最善の方法ではないことを知っています。 私はマッパークラスとレデューサークラスを作成しました。 マッパーコードで入力ファイルを読みました。 map reduceが完了したら、結果を同じ入力ファイルに保存します。どのように出力ファイルをマッパーから入

    1

    1答えて

    StandardScalerを使用してスケールされた機能を備えたKMeansが用意されています。問題は、クラスタのセンタイドも縮尺されていることです。プログラムで元のセンソイドを得ることは可能ですか? import pandas as pd import numpy as np from pyspark.ml.feature import VectorAssembler from pyspa

    0

    1答えて

    テンソルフローのKMeansClusteringにあらかじめ定義されたinital_centersを使用しようとしました。 /lib/python3.5/site-packages/tensorflow/python/ops/variables.py in _init_from_args(self, initial_value, trainable, collections, validate_s

    1

    1答えて

    私はk平均アルゴリズムの実装を視覚化するためにPCAを使用しようとしています。私はthis linkの主成分係数、スコア、分散についてのチュートリアルに従っています。 私は次のコマンドを使用しています:[coeff,score,~]=pca(X');ここで、Xは自分のデータです。 私のデータは30個の455個のマトリックスで、30個のフィーチャーと455個のサンプルがあります。私は正常にスコアパラ

    0

    1答えて

    私はTwitterユーザーの感情分析に関するプロジェクトを今行っています。私はK-Meansアルゴリズムを使用して、つぶやきを3つのクラスタ(正、負、中立)に分類します。しかし、私はまだ私のプロジェクトの評価について混乱しています。皆さんは、私のセンチメント分析のクラスタまたはパフォーマンスを評価するためにどのような方法やアルゴリズムを使用すべきであるかについての推奨はありますか? 貧しい私の英語