2009-03-05 24 views

答えて

5

Internet ExplorerをCOMオブジェクトとして使用できます(画面に表示されません)。たとえば、HTMLのプレーンテキスト版を入手するには:

Public Function Html2Text(ByVal Data _ 
    As String) As String 
     Dim obj As Object 
     On Error Resume Next 
     Set obj = _ 
     CreateObject("htmlfile") 
     obj.Open 
     obj.Write Data 
     Html2Text = obj.Body.InnerText 
End Function 

さらに複雑なことをするために要素ツリーを歩くこともできます。

クレジット:Karl Peterson in Visual Studio Magazine

2

を使用した例を探しています。パターンを作成し、HTMLから必要なデータを抽出します。このリンクでは、vb6で正規表現を使用する方法を知ることができます。http://www.regular-expressions.info/vb.html

0

HTMLが正しく構成されていない可能性があります。正規表現でタグを削除することは非常に困難です。別の方法として、Internet ExplorerをVBでCOMオブジェクトとして読み込み、Internet ExplorerでHTMLドキュメントを読み込んで解釈された要素ツリーを調べる方法があります。

関連する問題