知识大全 HtmlAgilityPack 抓取页面的乱码处理
Posted 知
篇首语:面对艰难困苦,懦弱者被磨去棱角;勇敢者将意志品质磨砺得更为坚强。本文由小常识网(cha138.com)小编为大家整理,主要介绍了知识大全 HtmlAgilityPack 抓取页面的乱码处理相关的知识,希望对你有一定的参考价值。
HtmlAgilityPack 抓取页面的乱码处理 以下文字资料是由(全榜网网www.cha138.com)小编为大家搜集整理后发布的内容,让我们赶快一起来看一下吧!
利用HtmlAgilityPack抓取页面很方便 但是当页面是gb 编码时候就会出现乱码 上网查了一下说是默认的获取页面方法不够成熟 具体什么的我也不知道 姑且就认为是不够成熟吧
HtmlWeb Web = new HtmlWeb();
HtmlDocument Document = Web Load(@url);
解决方法如下
新建一个方法来获取 HtmlDocument 传进来的是抓取页面的地址
private static HtmlDocument GetHtmlDocument(string url)
HttpWebRequest (new Uri(@url)) as HttpWebRequest; = GET ; WebResponse webResponse = ();
Stream stream = webResponse GetResponseStream();
HtmlDocument Document = new HtmlDocument();
Document Load(stream);
return Document;
根据@无机の剑 的评论 用这个属性就解决了(O(∩_∩)O~)
HtmlWeb Web = new HtmlWeb();
cha138/Article/program/net/201311/13856相关参考
页面乱码 这种乱码的原因是应为没有在页面里指定使用的字符集编码解决方法只要在页面开始地方用下面代码指定字符集编码即可代码如下 <%@pagecontentType="text
解决Java抓取页面遇到客户端身份认证的办法 以下文字资料是由(全榜网网www.cha138.com)小编为大家搜集整理后发布的内容,让我们赶快一起来看一下吧!&nbs
代码如下 <Connectorport=""protocol="HTTP/"connectionTimeout=""redirectPort=""/><Connecto
如何解决JSP页面显示乱码问题[2] 以下文字资料是由(全榜网网www.cha138.com)小编为大家搜集整理后发布的内容,让我们赶快一起来看一下吧! &n
如何解决JSP页面显示乱码问题[1] 以下文字资料是由(全榜网网www.cha138.com)小编为大家搜集整理后发布的内容,让我们赶快一起来看一下吧! &n
解决jsUTF-8传参到GBK页面乱码问题 以下文字资料是由(全榜网网www.cha138.com)小编为大家搜集整理后发布的内容,让我们赶快一起来看一下吧! jsU
JSP页面传值中文乱码的简单解决方法 以下文字资料是由(全榜网网www.cha138.com)小编为大家搜集整理后发布的内容,让我们赶快一起来看一下吧! 源代码ajs
页面中这段不起眼的代码<metaequiv="ContentType"content="text/;charset=GBK">错把如果charset=GBK设置为charset=UTF
由于XMLHTTP采用的是Unicode编码上传数据而一般页面采用的是gb这就造成显示页面时产生乱码而当在获取页面时的XMLHttp返回的是utf编码这就造成了显示产生乱码解决方法之一就是在PHP
ASP程序在同一个站点中如果有UTF编码的程序又有GB编码的程序时在浏览UTF编码的页面后再浏览当前网站GB的页面GB编码的页面就会出现乱码出现这样的问题是当你浏览UTF编码的时候服务器默认用UT