2017-02-21 6 views
0

DOMパーサーによって.htmlファイルを読み込もうとしていますが、解析中に次の例外が表示されます。Javaコードorg.xml.sax.SAXParseExceptionのHTML構文解析の例外

[Fatal Error] form3.html:559:133: The element type "font" must be terminated by the matching end-tag "</font>". 
org.xml.sax.SAXParseException; systemId: file:/home/puja/Dnyaneshwar/WCD_14_02_17/FileConverter/resources/form3.html; lineNumber: 559; columnNumber: 133; The element type "font" must be terminated by the matching end-tag "</font>". 
    at com.sun.org.apache.xerces.internal.parsers.DOMParser.parse(DOMParser.java:257) 
    at com.sun.org.apache.xerces.internal.jaxp.DocumentBuilderImpl.parse(DocumentBuilderImpl.java:347) 
    at javax.xml.parsers.DocumentBuilder.parse(DocumentBuilder.java:205) 
    at DomConverter.main(DomConverter.java:25) 
+1

オープンしている「」タグが閉じていないエラーがクリアされています –

+0

実際には、私はLibreオフィスでHTMLファイルに変換しました。ここで私は手動でファイルを編集することで上記のような問題を解決しましたが、そのファイルは非常に大きいです。だから私たちはそのようなチェックを無効にすることができます – Dnyanesh

答えて

1

xhtmlドキュメントでさえもHTMLドキュメントを解析するためにXMLパーサーを使用しません。

jsoupのようなhtmlパーサーを使用できます。