私はUTF-8-BOMでエンコードされたテキストファイルを持っており、その行の先頭に6~10桁の数字が付きます。Bashは2つの6桁の数字の間の文字列を取得します
私のbashスクリプトでさらに処理するこれらの「行」(番号を含む)を取得したいと思います。
sed -n '$line\p'
のforループを使うだけで簡単にできますが、残念ながらそれらの文字列の一部には改行が含まれているため、2つの6+桁の間に文字列を抽出する方法が必要です新しい行を示す数字(最初の数字を含む)。
3 "行" の例:私は必要なもの
123456\tA random string here
123567\t another string
this time
it goes over
multiple lines
124567\t a normal string again
:
123456\tA random string here
、
123567\t another string
this time
it goes over
multiple lines
と
124567\t a normal string again
いくつかのこと:
文字列は、残念ながら- ライン
- 数が増加し、その文字列の前の数字は、私が取得する必要があり
\t
にまたは\n
私はタブや改行のようなすべての特殊文字を変換したい- の背後にあるものよりも常に低く、 b文字列の長さを維持する必要があります。
私はまだここにいないので、これを間違った場所に置いたり、すでに回答があった場合は教えてください。
予想される出力を持つファイルのサンプルをコピーしてコピーできますか? – Inian
出発点として、おそらくこれを 'awk'で見てみたいと思うでしょう。 –
例が便利です! –