知识大全 HtmlAgilityPack 抓取页面的乱码处理

Posted

篇首语:面对艰难困苦,懦弱者被磨去棱角;勇敢者将意志品质磨砺得更为坚强。本文由小常识网(cha138.com)小编为大家整理,主要介绍了知识大全 HtmlAgilityPack 抓取页面的乱码处理相关的知识,希望对你有一定的参考价值。

HtmlAgilityPack 抓取页面的乱码处理  以下文字资料是由(全榜网网www.cha138.com)小编为大家搜集整理后发布的内容,让我们赶快一起来看一下吧!

  利用HtmlAgilityPack抓取页面很方便 但是当页面是gb 编码时候就会出现乱码 上网查了一下说是默认的获取页面方法不够成熟 具体什么的我也不知道 姑且就认为是不够成熟吧

  HtmlWeb Web = new HtmlWeb();

  HtmlDocument Document = Web Load(@url);

  解决方法如下

  新建一个方法来获取 HtmlDocument 传进来的是抓取页面的地址

  private static HtmlDocument GetHtmlDocument(string url)

  

  HttpWebRequest (new Uri(@url)) as HttpWebRequest; = GET ; WebResponse webResponse = ();

  Stream stream = webResponse GetResponseStream();

  HtmlDocument Document = new HtmlDocument();

  Document Load(stream);

  return Document;

  根据@无机の剑 的评论 用这个属性就解决了(O(∩_∩)O~)

  HtmlWeb Web = new HtmlWeb();

cha138/Article/program/net/201311/13856

相关参考

知识大全 jsp中文页面乱码与传参乱码

  页面乱码  这种乱码的原因是应为没有在页面里指定使用的字符集编码解决方法只要在页面开始地方用下面代码指定字符集编码即可代码如下   <%@pagecontentType="text

知识大全 解决Java抓取页面遇到客户端身份认证的办法

解决Java抓取页面遇到客户端身份认证的办法  以下文字资料是由(全榜网网www.cha138.com)小编为大家搜集整理后发布的内容,让我们赶快一起来看一下吧!&nbs

知识大全 java页面中文乱码

代码如下   <Connectorport=""protocol="HTTP/"connectionTimeout=""redirectPort=""/><Connecto

知识大全 如何解决JSP页面显示乱码问题[2]

如何解决JSP页面显示乱码问题[2]  以下文字资料是由(全榜网网www.cha138.com)小编为大家搜集整理后发布的内容,让我们赶快一起来看一下吧! &n

知识大全 如何解决JSP页面显示乱码问题[1]

如何解决JSP页面显示乱码问题[1]  以下文字资料是由(全榜网网www.cha138.com)小编为大家搜集整理后发布的内容,让我们赶快一起来看一下吧! &n

知识大全 解决js UTF-8传参到GBK页面乱码问题

解决jsUTF-8传参到GBK页面乱码问题  以下文字资料是由(全榜网网www.cha138.com)小编为大家搜集整理后发布的内容,让我们赶快一起来看一下吧!  jsU

知识大全 JSP页面传值中文乱码的简单解决方法

JSP页面传值中文乱码的简单解决方法  以下文字资料是由(全榜网网www.cha138.com)小编为大家搜集整理后发布的内容,让我们赶快一起来看一下吧!  源代码ajs

知识大全 如何解决html网页编码导致jsp页面乱码

  页面中这段不起眼的代码<metaequiv="ContentType"content="text/;charset=GBK">错把如果charset=GBK设置为charset=UTF

知识大全 ajax+php中文乱码的解决

  由于XMLHTTP采用的是Unicode编码上传数据而一般页面采用的是gb这就造成显示页面时产生乱码而当在获取页面时的XMLHttp返回的是utf编码这就造成了显示产生乱码解决方法之一就是在PHP

知识大全 解决asp中uft8和gb2312转换乱码问题

  ASP程序在同一个站点中如果有UTF编码的程序又有GB编码的程序时在浏览UTF编码的页面后再浏览当前网站GB的页面GB编码的页面就会出现乱码出现这样的问题是当你浏览UTF编码的时候服务器默认用UT