2016-05-27 4 views
0

40サンプルと50000遺伝子の情報を含む2つのマトリックスがあります。 Matrix Exprには各遺伝子とサンプルの遺伝子発現が含まれています。 Matrix Methylは、各サンプルについてこれらの遺伝子のメチル化状態を含む。発現とメチル化の両方の情報に基づいて(遺伝子やサンプルに)クラスタリングを行うことは可能ですか?私は、Rで基本的な階層的クラスタリングを実行する方法を知っています。 hclust(dist(M))しかし、それは1つのマトリックスだけです..任意のアイデア/アドバイス?2つのマトリックスを使用したクラスタリング

答えて

0

遺伝子発現とメチル化状態を考慮して類似性に基づいてサンプルをクラスタリングする場合は、すべての50000遺伝子の遺伝子発現と遺伝子メチル化状態がすべて各サンプルの「特徴」であると考えることができます。

したがって、MethylとExprの両方の行列を連結して40x100000の行列とし、その行列のdist()を計算することができます。

同様に、あなたはその違いに基づいて遺伝子をクラスタ化する場合には、あなたは

はそれが役に立てば幸い80x50000マトリックス上に両方の行列を連結することができます。

+0

ここでの問題は、遺伝子発現およびメチル化が、2つの異なるメトリック(非常に異なるダイナミックレンジを用いて)を用いて表されることである。 –

0

両方の行列を考慮に入れた類似性を定義する必要があります。

単純に、これは

dist <- dist(A) + dist(B) 

と同じくらい簡単かもしれないが、一般的に、クラスタリングは、スケールに非常に敏感であり、これらの問題は、どのようなアプローチは非常に困難になります。申し訳ありません - この問題に対する「正しい」または自動的な解決策はありません。

+0

多分、すべての列でscale()関数を使ってexprとメチル行列をスケールすることができます。私は試してみます –

+0

確かに* can *です。あなたが求めるべき質問は、それがあなたの結果にどのように影響するかです。 –

関連する問題