2016-12-01 6 views
0

modularty edge_weight/randomizedは、同じネットワーク上で少なくとも1回、少なくとも20回の分解能で実行されています。これは、以下のルールに基づいて作成したのと同じネットワークです。少なくとも1つの項目が共通している場合、2つのノードは関連しています。モジュール化を実行するたびに、私はコミュニティ間で少しずつノードの分布を取得します。さらに、私は9または10のコミュニティを取得しますが、一貫性がありません。どんなコメントや助けも大歓迎です。反復モジュール性

答えて

0

答えはアルゴリズムのランダム化部分にあると思います。あなたは、ここで詳細を見つけることができます。

https://github.com/gephi/gephi/wiki/Modularity

https://sites.google.com/site/findcommunities/

http://lanl.arxiv.org/abs/0803.0476

+0

ありがとうございました。感謝します。同じネットワーク上でモジュール化を100回実行し、100回の実行に少なくともある割合(たとえば60%)以上を維持し、それを最終的なモジュール性と呼ぶ関係に基づいてコンセンサスネットワークを選ぶのは正しいですか?最高のクラスタリング係数などのネットワークトポロジパラメータに基づいて60%を選んでいます。私は、100回の試行に沿ってモジュール性アルゴリズムによって60%以上と呼ばれたエッジだけでモジュールを構築しています。 – mparida

1

私はコンセンサスクラスタリングを使用して私の問題への解決策を見つけました。ここにそれを記述する論文があります。スペクトルクラスタリングを使用して高次元空間内でそれらを解かなくても最適なクラスタを得る1つの方法は、それ以上パーティションを達成できなくなるまでアルゴリズムを繰り返し実行することです。ここに記事と完全な説明の詳細があります:

科学的なレポート| 2:336 | DOI:10.1038/srep00336 複雑なネットワークにおけるコンセンサスクラスタリングAndrea Lancichinetti & Santo Fortunato

コンセンサスマトリックス。ネットワーク上のクラスタリングアルゴリズムで見つかったnPパーティションとn個の頂点を組み合わせたいとします。コンセンサス行列Dは、n×n行列であり、そのエントリDijは、ネットワークの頂点iおよびjが同じクラスタに割り当てられたパーティションの数を、パーティション数nPで割ったものを示す。コンセンサス行列では、同じクラスタ内に少なくとも1回共起した任意の2つの頂点の間にエッジがあるので、行列Dは通常、元のネットワークの隣接行列Aよりもはるかに密度が高い。一方、重みは、最も頻繁に共クラスタ化される頂点に対してのみ大きく、低重みは、異なる(実際の)クラスタ間の境界にある可能性が高いことを示しているため、同じクラスタにおけるそれらの分類は、ノイズに。大きな重みを維持し、低い重みを落としたいので、フィルタリング手順が順調です。とりわけ、フィルタリングがない場合、コンセンサスマトリックスは急速に非常に高密度のマトリックスに成長し、クラスタリングアルゴリズムの適用が計算機的に高価になる。我々は、閾値以下のすべてのDのエントリを廃棄する。エッジがすべてしきい値を下回り、もはや接続されないノイズのある頂点があるかもしれないことを強調します。このような状況が発生した場合、最も重い重みを持つ隣人にそれらを接続するだけで、グラフがすべてプロシージャに接続された状態に保たれます。

次に、同じクラスタリングアルゴリズムをDに適用し、別のセットのパーティションを作成します。これは、前述のように新しいコンセンサスマトリックスD9を構築するために使用されます。この手順は、コンセンサス行列がブロック対角行列Dfinalになるまで反復され、その重みは、同じブロック内の頂点に対して1、異なるブロック内の頂点に対して0に等しい。行列Dfinalは元のネットワークのコミュニティ構造を提供します。我々の計算では、典型的には、安定した結果を導くのに1回の反復で十分である。同じクラスタリング方法を使用するためには、コンセンサス行列が重み付けされているため、後者は重み付けされたネットワーク内のクラスタを検出できなければならないことに注意してください。これは、ここで提案された手順を使用できる方法の選択に必要な制約である。しかし、文献のほとんどのクラスタリングアルゴリズムは重み付けされたネットワークを扱うことができるか、またはそれらを処理するために自明に拡張することができるため、厳しい制限ではありません。