これは私のサンプル文字列であると仮定します。正規表現は、分割されたインデックスに長さと、隣接する文字に基づいて文字列を分割する
String s = "Just a sa'mple 'String.";
私はトークンの長さが常に未満または5つの文字に等しくなりますようにこの文字列を分割したいですまた、分割インデックスの隣接する文字は、英数字または空白のいずれかです。
String tokens[] = s.split(<regex>);
そこでここでは、トークン配列は、文字列トークン以下含まれている必要があります
"Just ","a s","a'mpl","e 'St","ring."
注秒のトークン「S」は3文字のみを持つことが期待されていること。 "a sa"や "a sa"のような2番目のトークンを分割することはできません。最初のケースで分割インデックスの前に非英数字 "'"(一重引用符)の前になり、 2番目のケース。
私はJavaを使用してこれを達成しようとしています。
英数字または空白以外の分割インデックスの隣接文字を検出した場合、文字列を反復処理して分割インデックスをデクリメントしようとしました。私の現在のアプローチは、コードを複雑にして、代わりに正規表現を使用するとコードを単純化すると感じています。
英数字または空白以外の分割インデックスの私の現在のアプローチは、コードをコンパイルし、代わりに正規表現を使用するとコードを単純化すると感じています。ノートパソコンにアクセスするとすぐにコードスニペットで質問を更新します。 –
落札理由をご記入ください。それは私がこの質問と今後の質問を改善する助けになるかもしれません。 –