「セパレータ」がデータの一部になるパースストリング？

私はこれらのようなSTDの文字列を持っている：「セパレータ」がデータの一部になるパースストリング？

ユーザー名：メッセージ

最初のを見て、それは簡単な問題のように見えますが、この問題は可能性があり、その名前の最後の文字である「：」と最初の文字を文字列のメッセージ部分の '：'でもかまいません。ユーザーは名前にスペースを入れることもできます。

したがって、ユーザーが名前「いくつかの名前：」あるかもしれない私が持っているん

とメッセージを入力可能性があります「こんにちは、いくつかの名前を：：：」：次のようになり

「こんにちは」をユーザー名のリスト（ベクトル）。

このように、このような文字列からユーザー名を抽出する方法はありますか？（理想的には、ユーザーのリストを反復することなく）

おかげ

出典

2012-04-18 jmasterx

少なくとも、問題が単純なケースと複雑なケースに分かれるのは、 ''： ''が1つしかないかどうかをチェックすることです。 – twain249

メッセージはどのように分離されていますか？とともに '：'？ – AlexTheo

'：'付きサンプル：あなた：考える： – jmasterx

(\w+?):\ \w+ようregexをお試しください。

出典

2012-04-18 19:56:36 nes1983

問題は根本的にあいまいです。 "name：：Hello"と指定すると、追加のコロンが名前の末尾かメッセージの先頭かを判断する方法はありません。正規表現は、実装がどれほど貪欲であるかによって、どちらか一方を選択します。 –

まあ...ほとんどの正規表現の実装はかなり決定的です。貪欲は最初のチャンスで、最初は貪欲ではない。 – nes1983

ユーザ名に「：」文字が含まれていないことを確認できず、チェックするたびにリスト全体を反復しないようにしたい場合は、ショートカットを試すことができます。

特殊文字を含むユーザー名のみのベクトルを保持します（これはすべてのユーザー名の一部です）。それらを最初にチェックします。一致するものが見つかった場合は、[username]の後の文字列を取ってください：。それ以外の場合は、単純にコロンで分割することができます。

出典

2012-04-18 19:58:34

私はこのに近づくような方法は、単に最初のコロンを見つけることです

string text = "token, test string"; 

char_separator<char> sep(":"); 
tokenizer< char_separator<char> > tokens(text, sep); 
BOOST_FOREACH(string t, tokens) 
{ 
    cout << t << "." << endl; 
}

出典

2012-04-18 19:58:40 Erwald

文字列トークンを使用します。そこに文字列を分割し、残りの2つの文字列をトリミングします。

なぜ、追加のコロンがあるのか、それらが値の一部であるのか、私には完全には分かりません。削除する必要がある場合は、削除する必要があります。

出典

2012-04-18 19:59:43

「セパレータ」がデータの一部になるパースストリング？

答えて

関連する問題