2017-12-23 15 views
1

誰か助けてください。この正規表現を動作させようとしていて、ほぼそこにあります。技術
word_en:(+ M、F)空白と句読点を追加して最初のグループを正規表現で取り込む方法は? LibreOffice内の特定のタブを2つの列に分割する方法を教えてください。

最初のテスト文字列がある:

性別 ラ
、EL:それらはすべて正確であるように見えるが、最初のものは次のようになります

ワード

1 

el, la art the (+m, f) 
• el diccionario tenía también frases útiles – the dictionary also had 
useful phrases 
2055835 | 201481381 

その他の問題は、単純に情報をコピーしようとしていることです。 「置換」セクションからLibreOfficeに移動します。私がしたいのは、データの6つの列を作成することだけです。問題は、列 'G'にあるsent_enのすべてのデータではなく、第6列(sent_en)が時には列 'G'と 'A'との間で分割できることです。 「Substitution」の下のデータをLibreOffice Calcにコピーすると、私の意味をよりよく理解できます。私はちょうどこれを把握することはできません、誰かが私を助けることができる場合は、私は本当にそれを感謝します。ありがとう。

ここのリンクはこの1つは少し毛深いだったが、すべての後に、ほんの少しの調整が必要だったhttps://regex101.com/r/m3yySN/2/

^ 

(?<frequency>[0-9]+) \W+ 
(?<word>\pL+\W?) \h+ 
(?<gender> [\pL()]+ (?:, \h* [\pL()]+)*) \h+ 
(?<word_en> [^•]*[^•\s]) \h* \R 

• \h* 
(?<sent_esp> [^–]*[^\s–]) \s*–\s* 
(?<sent_en> .* (?:\R .*)*?) \h* \R 

(?<num1> [0-9]+) \h* \| \h* 
(?<num2> .*\S) 

\1\t\2\t\3\t\4\t\5\t\6\t 
+3

実際の質問にすべてのコードを含める必要があります(コピー/貼り付け)。第三者サービスへのリンクを例として使用できますが、その質問を理解する必要はありません。リンクが変更/削除された場合、この質問は将来の訪問者には役に立たないでしょう。 [最小限で完全で検証可能なサンプルの作成方法](http://stackoverflow.com/help/mcve)と[どのように良い質問をしますか?](http://stackoverflow.com/jp)をお読みください。 help/how-to-ask) –

+0

フォローアップの質問はhttps://ask.libreoffice.org/en/question/141538/how-do-you-prevent-a-tab-delimited-txt-fileに掲載されています。 -from-each-group /の行間の分割から。 –

答えて

0

です:

^ 
(?<frequency>[0-9]+) \W+ 
(?<word>\pL+(?:,\h\pL+|\W)*) \h+ 
(?<gender> [\pL()]+ (?:, \h* [\pL()]+)*) \h+ 
(?<word_en> [^•]*[^•\s]) \h* \R 
• \h* 
(?<sent_esp> [^–]*[^\s–]) \s*–\s* 
(?<sent_en> .* (?:\R .*)*?) \h* \R 
(?<num1> [0-9]+) \h* \| \h* 
(?<num2> .*\S) 

Results今私にはよく見ます。

+0

ねえ、本当に感謝します。ご協力いただきありがとうございます。 – user8383901

関連する問題