私はそういう単一のフィールドを持つファイルを持っています。awkの一致するレコード
scaffold10017|size24957-5236
scaffold10017|size24957-5236
scaffold10017|size24957-5236
scaffold10017|size24957-7124
scaffold10076|size19532-3212
scaffold10076|size19532-6287
scaffold1008|size40169-12384
scaffold1008|size40169-12399
scaffold1008|size40169-21350
scaffold1008|size40169-34740
私は、このフィールドと値によってインクリメント値を持つ2番目のフィールド(100,000言う)レコードは、フィールドで前のレコードと一致しないすべての時間を含む新しいファイルを印刷したいです。したがって出力は次のようになります。
scaffold10017|size24957-5236 0
scaffold10017|size24957-5236 0
scaffold10017|size24957-5236 0
scaffold10017|size24957-7124 0
scaffold10076|size19532-3212 100000
scaffold10076|size19532-6287 100000
scaffold1008|size40169-12384 200000
scaffold1008|size40169-12399 200000
scaffold1008|size40169-21350 200000
scaffold1008|size40169-34740 200000
これを行う方法を誰かが示唆してくれれば幸いです。
行は空白で区切られていますか? – kev
いいえ、行間にはスペースを入れないでください。 – user1308144