2011-07-09 8 views
1

パーサーを使用して、本文テキスト内の特定のH2(またはh3/h4/h5/h6)テキストの出現の位置番号を特定したいと考えています。位置番号は、この特定のh2(またはh3/h4/h5/h6)フレーズの前に発生した「単語」の数のカウントを意味します...フレーズがh2とh4の両方のテキスト(たとえば)これらのテキストの両方に対して正しい位置番号を取得する方法を確認するにはどうすればよいですか?Jericho HTMLパーサーに関する質問

答えて

1

このような非標準要件を実行する簡単な方法はありません。

あなたは、タグを見つけ、その中にテキストを見つけ、その位置を覚えて、前にすべてを解析し、単語を数えなければなりません。ロケット科学ではありませんが、コード化とテストには時間がかかります。