2016-04-23 5 views
0

私は例としてこの行を持っています。これが私のデータのラベルです: d__Bacteria | p__Proteobacteria | c__Betaproteobacteria | o__Burkholderiales | f__Alcaligenaceae | g__Advenella私のデータラベルを短くする

私のデータのラベルのすべてがこの形式です。私がしたいのは、g__Advenellaである最後の部分を残して、ほとんどの部分を削除することです。私はあなたが私を助けることができるなら、私はかなりの午前と急いでいるので、それは私に多くの時間を節約します。私はすでに自分のデータのラベルを抽出し、それをテキストファイルに保存しました。

+0

基本 'sedは-i.bakの/^.* |(。* G $ \)は\/\ 1/'filename'は場所でそれを行うだろう。 –

答えて

0

Perl、Sed、またはAwkを使用します。

パール

perl -pe 's/^.*\|([^\|]+)$/\1/' input-file > output-file 

SED

sed -r 's/^.*\|([^\|]+)$/\1/' input-file > output-file 

AWK

awk 'BEGIN{ FS="|"; } {print $NF}' input-file > output-file 

P UREバッシュ

while read -r line; do 
    echo ${line/*|/} 
done < input-file > output-file 
+0

うわー。あなたが素晴らしいです。ありがとう! –

関連する問題