2015/07/11

[筆記] HTML Agility Pack

最近心血來潮要爬某個地方的 html 來用, Google 了一下發現了 HTML Agility Pack 這個套件




套件可於 nuget 上取得

使用時需先 using

 using HtmlAgilityPack; 


接著用 webrequest 撈下對應網址的 html


     WebRequest request = HttpWebRequest.Create(Url);

     var response = request.GetResponse();
            
     HtmlDocument htmlDoc = new HtmlAgilityPack.HtmlDocument();

     htmlDoc.Load(response.GetResponseStream(), true);


之後就跟操作 XmlDocument 一樣啦

像是
     //取得所有a tag
     var aNodes = htmlDoc.DocumentNode.Descendants("a");

沒有留言:

張貼留言