2011-08-15 14 views
2

私はいくつかのマークアップされたデータのためのパーサーを書いています、そして、私は、最終結果の開始タグと終了タグのようなものを破棄して、データだけを残しておくようにしたいと思います。解析された文字列の一部を破棄するようにpyparsingに指示するにはどうすればよいですか?

これを行うことはできますか、または値を適切に指定して手動で取り出すだけでよいですか?

+0

マークアップタグがXMLのように見える場合は、 'makeHTMLTags'と' makeXMLTags'もチェックしてください。これらのヘルパーは文字列の周りに '<>'を追加するだけでなく、埋め込み属性、大文字と小文字の違い、迷いのある空白があります。 – PaulMcG

答えて

1

"抑制"はおそらくあなたが望むものです。 dont_care = Suppress(Word(alphas))のようにSuppressクラスを明示的に使用するか、任意の式のsuppress()を呼び出すことができます(dont_care = Word(alphas).suppress())。これにより、一致するトークンが解析された出力に表示されなくなります。

関連する問題