0
特定のCSSセレクタに一致するタグを削除できるように、HTMLファイルを処理する簡単な方法はありますか?私の動機は、pandoc
は、私の見解ではあまりにも冗長で、<span class="math inline"> ... </span>
という数値計算式を囲むHTML出力を生成するということです。一般に...
で十分です。ディスプレイの数学では、入力と出力に改行がある傾向がありますので、grep
などの専用ツールを使用してください。目標は帯域幅の使用量を減らすことであり、クライアント側では何も起こりません。CSSセレクタと一致するタグ(コンテンツではない)を簡単に削除できますか?
?それはサーバー側かクライアント側ですか?これまでに何か試しましたか? –
@NeriBarakatこれは言語に依存しない質問ですが、実際にはこれに適したツールがあるかどうかが大半です(おそらく 'lxml'ですか?)。一時的にEOLを未使用の文字に変更した後、 'grep'を使って' \([^ <] [^ <]*\) ' –
pandocは、スパンタグを挿入して、mathjaxのようなjavascriptライブラリが適切に数式を表示できるようにします...もちろん、あなたのhtml処理ツールでそれらを削除することもできます。例えばnokogiriを使用している場合Ruby ... – mb21