異なるファイルのggplot2で、グラフ化の目的で一意の文字列ごとに特定のカラーコードを割り当てるルールを作成しようとしています。たとえば、私は2つのタブ区切りのファイルを持っている場合は、FILE1.TXTとFILE2.TXT次のようになり、その:複数のファイルで一意の文字列ごとにカラーコードを割り当てる - R
FILE1.TXT
Freq Seq
90 AAGTGT
3 AAGTGG
3 AAGTCC
2 AATTTT
2 TTTTTT
FILE2.TXT
Freq Seq
91 AAGTGT
4 AAGTGG
2 AAGTCC
2 CCCCCC
1 TTTTTT
上記のファイルには、6つの差分のために合計6つの色が使用されます(AAGTGT、AAGTGG、AAGTCC、CCCCCC、TTTTTT、AATTTT)を含む。私の多くのファイル間、私は私が
pal<-c(randomColor(count=2951))
を使用するためのパレット(pal
)を作成しました〜3000色を持っている私の多くのファイルの中の全ての配列が文字列の順序対を維持することを確実にする方法はありますし、対応する16進カラーコード(すなわち、AAGTGTシーケンスを示すすべてのファイルは、その文字列に対して同じ16進数のコードを持つことになります)?注目すべきは、各ファイルに3000色すべてが表示されているわけではありません。
ありがとうございます!
3000色を区別することができる方法を誰もがありません
df2
でも同じです。 1つのプロットで3000色すべてが表現されているわけではありませんが、区別がつかない10色で終わることがあります。私はあなたがしようとしていることを理解していません。 –