2012-08-24 13 views
7

私のコードでは、src値を持たないimgタグを削除したいと思います。 私はHTMLAgilitypackのHtmlDocumentオブジェクトを使用しています。 srcの値がなく、削除しようとしているimgを見つけましたが、エラーが発生します。コレクションは変更されました。列挙操作が実行されないことがあります。 誰も私にこれを手伝ってもらえますか? 私が使用しているコードがある:それはあなたがHtmlNode.RemoveChildメソッドを使用して列挙中にコレクションを修正しているようだhtmldocumentからhtmlノードを削除する:HTMLAgilityPack

foreach (HtmlNode node in doc.DocumentNode.DescendantNodes()) 
{ 
    if (node.Name.ToLower() == "img") 
    {        
      string src = node.Attributes["src"].Value; 
      if (string.IsNullOrEmpty(src)) 
      { 
       node.ParentNode.RemoveChild(node, false);  
      } 
    } 
    else 
    { 
      ..........// i am performing other operations on document 
    } 
} 

答えて

6

がある:それは私の作品

List<string> xpaths = new List<string>(); 
    foreach (HtmlNode node in doc.DocumentNode.DescendantNodes()) 
    { 
         if (node.Name.ToLower() == "img") 
         { 
          string src = node.Attributes["src"].Value; 
          if (string.IsNullOrEmpty(src)) 
          { 
           xpaths.Add(node.XPath); 
           continue; 
          } 
         } 
    } 

    foreach (string xpath in xpaths) 
    { 
      doc.DocumentNode.SelectSingleNode(xpath).Remove(); 
    } 
17

これを修正するには、ノードを別のリスト/配列にコピーする必要があります。 Enumerable.ToList<T>()またはEnumerable.ToArray<T>()

var nodesToRemove = doc.DocumentNode 
    .SelectNodes("//img[not(string-length(normalize-space(@src)))]") 
    .ToList(); 

foreach (var node in nodesToRemove) 
    node.Remove(); 

私が正しいとすれば、問題は消えてしまいます。私がやっていること

+0

おかげで..! – Priya

+0

@Piya、それを聞いてうれしい。しかし、私は1つのxpath式を使うと、コードを読みやすくすることができます(1つの式ですべてのノードを選択するだけです)。 – Alex

+0

、そうですよ。私はそれをするでしょう。もう一度ありがとう! – Priya

2
var emptyImages = doc.DocumentNode 
.Descendants("img") 
.Where(x => x.Attributes["src"] == null || x.Attributes["src"].Value == String.Empty) 
.Select(x => x.XPath) 
.ToList(); 

emptyImages.ForEach(xpath => { 
     var node = doc.DocumentNode.SelectSingleNode(xpath); 
     if (node != null) { node.Remove(); } 
    }); 
関連する問題