similarity

    4

    1答えて

    私は1000人のユーザーとそのネットワークの隣接リストを持っています。私はigraphライブラリを使用しています。 私が使用してグラフを作成しました: graph.adjlist(adjlist, mode = c("out", "in", "all", "total"),duplicate = TRUE) を次に、各ユーザ間の類似性を見つけるために: similarity.jaccard(g

    7

    1答えて

    連続した行と列の間の変更回数を最小限に抑えるために、バイナリデータを含む行列の行と列を並べ替える方法について説明したa spreadsheetになりました。例えば が始まる: spreadsheedのタブで説明15の手動手順は、次の表が得られた後 : 私がしたいです知っている: このアルゴリズムまたはメソッドの共通名は何ですか? 大きなテーブルに適用する方法(2^nがオーバーフローする...) L

    1

    2答えて

    私はsimhashと一緒に働いていますが、minhashがより効果的であることも見ています。 しかし、私は理解していません。 私のために説明してください:simhashよりもさらに有利なミニハッシュはありますか?

    0

    1答えて

    文字列間の類似度を計算し、すべての一意の文字列を与えるScalaコードがあります。 val filtered = z.reverse.foldLeft((List.empty[String],z.reverse)) { case ((acc, zt), zz) => if (zt.tail.exists(tt => similarity(tt, zz) < threshold

    1

    1答えて

    I持ってsringsの1列と1セル配列: F = 'ABCD' R = {'ACBD','CDAB','CABD'}; 私はR内のすべての文字列と文字列Fを比較したいと思いますF(1)= 'A'かつR {1}(1)= 'A'ならば、1(それらは同じ値 'A' {1}(2)= 'C'私たちは0をカウントします(異なる値を持つため)...そして、それはすべての文字列の終わりまでです。 こ

    -2

    1答えて

    は現在やってプロジェクトに取り組んで次 は、(すべての良い)のテキストの大きな体に2と5単語間の最も一般的なフレーズを取得 リターン$フレーズ=> $出現した配列 私は今、この配列内の各値を取り、その場合、配列の残りの部分で同様のものがあるかどうかを確認して、1にそれらをマージし、その発生を総括したいです。 similar_text()を使用して、フレーズとどれほど類似しているかを比較し、95より

    0

    2答えて

    ベクトルの2つの要素、例えばstd :: vectorを接続する方法がC++にあるかどうかを知りたいのですが、一方が変更された場合は自動的に変更されます。そうでない場合は、他の方法がありますか? ありがとうございました。

    0

    1答えて

    私はES 1.4からES 2.3にアップグレードしており、ドキュメントのスコアリングをテストしている間に同じクエリのExplain APIの出力の違いに気づいた: { "value": 0.9890914, "description": "fieldWeight in 3931, product of:", "details": [ { "val

    6

    1答えて

    私は以下のようなデータフレームを持っています。フレームの形状は(1510,1399)です。列は製品を表し、行は特定の製品に対してユーザーによって割り当てられた値(0または1)を表します。どうすればjaccard_similarity_scoreを計算できますか? 私はdata_ibsの類似性を計算するためにかかわらず、反復するかどうかはわからない製品 data_ibs = pd.DataFrame

    1

    2答えて

    Asioライブラリの例を参照して、this one for example(たとえば37行目)を見ると、時にはこれから共有ポインタを作成することがあります。彼らはいくつかのasio関数を呼び出すラムダでそれをキャプチャしますが、私はそれの目的を理解していません。私はそれが使用されて表示されません。 だから、なぜ彼らはこれをしますか? 関連するコード :(セッションが作成された)サーバークラス...