を更新することにより、2つの長さの異なるデータ・フレームをマージ:は、次のデータフレームを考慮した情報
> tail(tot.final)
names.id sequence names.reads width.reads names.counts st end flag
819 125546 TAGCTTATATGACTGATGTTGACA 125546-4 24 4 8 31 TRUE
820 218783 TCGCTTATCAGACTGATGTTGAAA 218783-2 24 2 8 31 TRUE
821 272992 CAGCTTATCAGACTGATGTTGAAA 272992-2 24 2 8 31 TRUE
822 135191 TAGCTTATCAGACTGATGTTGAACA 135191-4 25 4 8 32 TRUE
823 278047 TAGCTTATCAGACTGATGTTGAAGA 278047-2 25 2 8 32 TRUE
824 317980 TAGCTTATCAGACTGATGTTGCCCT 317980-2 25 2 8 32 TRUE
head(plusa)
names.id sequence names.reads width.reads names.counts st end flag
2 28092 ATCAGACTGATGTTGAC 28092-29 17 29 14 30 TRUE
4 65308 TTATCAGACTGATGTTGA 65308-10 18 10 12 29 TRUE
6 71226 TATCAGACTGATGTTGAC 71226-9 18 9 13 30 TRUE
> nrow(tot.final)
[1] 824
> nrow(plusa)
[1] 421
plusa contains 451 rows with a common plusa$sequence column. (not sorted)
Iは、対応のplusaする$ names.counts値を加算することによりtot.final $ names.counts要素を更新したいですプラス$配列。
"sequence"フィールドをidと見なしてこのようにマージする可能性はありますか?
質問 - 'names.id = 4'と'シーケンス= 'TTATCAGACTGATGTTGA''のためにあなたの 'plusa'、どの行でtot.final''であなたべきそれらはすべて同じシーケンスを持つように見えるので、それを追加しますか?そして、新しい 'names.id'、' st'、 'end'、' width.reads'などの値を 'plusa'から、あるいは' names.counts'だけを更新したいのですか? –
names.idはカウントされませんが、それはplusaのシーケンスIDと一致しないシーケンスIDです。 ;私は新しい名前を格納したいだけです。数量 – agatha
ごめんなさい、私はシーケンスを誤読しました。だから 'TAGCTTATCAGACTGATGT 'という配列を持つ' plusa'の行を 'tot.final'の行に入れたいのであれば(最初の4つはすべて同じシーケンスを持つので)、それを追加しますか?または、 'sequence'と 'counts'を持つ新しいデータフレームを必要としますか? 'TTATCAGACTGATGTTGA'の 'counts'は1505 + 46 + 26 + 23 + 'plusa'にマッチします。 –