similarity

    2

    1答えて

    私はpython-gloveがどのように計算するのかを理解しようとしていますmost-similar用語。 コサイン類似性を使用していますか? のpython-グローブgithubの https://github.com/maciejkula/glove-python/tree/master/gloveから例: Iはgensimのword2vecから、most_similar方法は、コサイン距離を

    0

    2答えて

    私は機械学習の初心者です。 私はモデルを構築するための提案が必要です。ここに問題文があります - 私は特定の会社のすべての製品(4製品)を所有する顧客のデータセットを持っています。X - このセットをCust4と呼んでください。 同じ会社のいくつかの製品(3製品)しか所有していない顧客の別のデータセットもあります。X - このセットをCust3と呼んでください。 私は両方のデータセット(テキストデ

    3

    1答えて

    私の目的は、その属性に基づいて2人のユーザー間の類似度を計算することです。たとえば、プレーヤーを考えて、年齢、給料、ポイントを属性として考えてみましょう。 また、重要度の順に各属性に重みを付けたいとします。私の場合、年齢は給料とポイントよりも重要な属性です。したがって、ユークリッド距離を使って類似度を計算すると仮定しましょう。 Given user 1 who is age 20, salary

    2

    1答えて

    2つのリストの要素の点相互情報スコアを計算したいと思います。 のは、私たちは、私はその後、すべてのペアのPMIスコアを計算することができますどのように ListA = "Hi there, This is only a test message. Please enjoy the weather in the park." ListB = "work, bank, tree, weather,

    0

    1答えて

    Gensimの実装でword2vecとdoc2vecベクトルの関係を理解し​​ようとしています。私のアプリケーションでは、同じラベル(トピック)で複数のドキュメントにタグを付けるので、単語ベクトルを訓練するためにdbow_words = 1を使用して、私のコーパス上でdoc2vecモデルを訓練しています。私は多くの意味を成しているこのようなやり方で、単語と文書のベクトルの間に類似点を得ることができ

    1

    1答えて

    私は初めてGensimを試しています。今質問があります。私は準備された文書のコーパスを使ってLSIモデルを訓練しました。私の質問は、新しい文書が文書のコーパスから生成されたモデルに類似しているかどうかを知る方法です。 MatrixSimilarityのように、コーパス内の各ドキュメントに対するドキュメントの類似性を知りたいのではなく、ドキュメントが自分のトピック/モデルと似ているかどうかを知りたい

    1

    1答えて

    私は機械学習には新しく、次の問題を試してみようとしています。 入力は同じ長さの記述の2つの配列で、出力は第1の配列の最初の文字列と2番目の配列の最初の文字列との類似性スコアの配列です。 配列内の各項目(numpy配列)は文字列です説明の。同一の共起語IDがどれくらいあるかを計算して2つの文字列間の類似度を調べ、それにスコアを割り当てることで関数を書くことができますか(1つの可能な重みは共起の頻度と

    0

    1答えて

    私は、それらがどれほど類似しているかに基づいて、入れたいフォルダにたくさんの画像を持っています。私が試してみました何 : 私は最初の画像を撮る、すべてのそれを比較して、最高の試合でそれを一致:画像は(http://www.proteinatlas.org/images/36302/112008_A_6_6.jpg例えば)組織マイクロアレイからの組織切片です。それから、私は最も近い試合をして、同じこ

    0

    1答えて

    私は4000列のデータを2000行持っています。私がしようとしているのは、各行を残りの行と比較して、それぞれが異なる列/合計列に関してどれほど似ているかを確認することです。次のように私はこれまでのところで何をしたか :それで2つの問題がある for (i in 1:nrow(data)) { for (j in (i+1):nrow(data)) { mycoun

    1

    2答えて

    私はFindSimilarというクラスを持っています。このクラスはminHashを使って2セット間の類似点を見つけます(この目的のためにはうまくいきます)。私の問題は、2セット以上を比較する必要があることです。具体的には、与えられたset1と未知の量の他のセットとを比較する必要があります。ここではクラスがある: import java.util.HashSet; import java.util