現在、QtでPython split()関数(引数なしのデフォルトバージョン)の動作を正確に再現しようとしています。QtのPython string.split()関数の動作を複製する
私はので、私は次のように使用してみました、デフォルトの区切り文字はCR/LF/TAB記号の任意の数であると言われています
s_body.split(QRegExp("[\r\n\t ]+"), QString::SkipEmptyParts);
しかし、これは正確にその動作を複製しません。
これを約4メガバイト分のテキストで実行し、一意の単語の数を数えれば133293になります。しかし、私がPython関数を使って同じ結果を出した場合、結果は133367になります。間違い。
これを修正する方法についてのご意見は大歓迎です。
あなたが言ったようにして空の部分を保持しようとしました。しかし、これはうまくいかなかった。また、区切り文字として[\ v \ f \ r \ t \ n] +を試しました。これはまだ私がこれでテストしたファイルの大部分について正確な結果を得ていませんでした(しかし、正規表現ではそれが正しくなったファイルの割合はわずかに増加しました)。 – user129186