如此一来,想要依照规则来剖析 HTML 文件几乎变得不可能,而且对方的网站的 HTML 结构也可能会随时变化,在这种情况下,剖析 HTML 变得非常辛苦,虽然 W3C 有另外推展 XHTML(遵守 XML 严谨格式的 HTML),但使用它来设计网页的案例仍为少数,大多数的网站仍然是使用 HTML。
因此我们会需要一个工具,能够有方法快速的解析 HTML 以取出我们需要的数据。
我用1.4.6的 HtmlAgilityPack 没有这个方法。
HtmlWeb web = new HtmlWeb()var doc=web.Load("http://www.baidu.com")
背景图貌似要先登录百度才会有的