2017-05-26 1 views
-2

短い記述を生成する必要がある長い文字列があります。私は長い文字列から75単語を取る必要がある短い記述を生成するために、これは正規表現を使用して行うことができますか?正規表現を使用して文字列から決められた数の単語だけを取得するにはどうすればよいですか?

(?:\w+\W*){1,75} 

詳細:

+3

これまでに何を試しましたか? – degant

+0

試したコードを貼り付けてください。お手伝いします。 – Mohit

+1

正規表現ではなく['text summarization'](https://stackoverflow.com/questions/5479333/summarize-text-or-simplify-text)が必要になると思われます –

答えて

0

このような何か試してみてください、

  • "単語" 文字の非空のシーケンスを
  • "非単語" 文字のオプションのシーケンス(オプション入力が正確に75語で、それ以外の単語がない場合は )、非キャプチャグループ内の
  • (それ以外の場合は最初のキャプチャg最後の単語が に含まれています)、
  • 1から75回の繰り返しです。

フルマッチはすべてのテキストをキャッチします。あなたは75ワードの唯一最初 セットをキャッチしたいと

は、グローバルスイッチを使用しないでください。

関連する問題