jsoup获取html页面乱码

java10001 发布于 2013/10/29 13:27
阅读 3K+
收藏 0

有人知道为什么我用jsoup获取这个页面一直都是乱码,编码都尝试了一遍都不行

http://sports.xinmin.cn/2013/10/27/22446248.html

有人有时间的话帮忙看看?


public static String readHtml(String myurl) 
	{
	    StringBuffer sb = new StringBuffer("");
	    URL url;
	    try {
	        url = new URL(myurl);
	        BufferedReader br = new BufferedReader(new InputStreamReader(url.openStream(), 
	        		"UTF-8"));
	        String s = "";
	        while ((s = br.readLine()) != null) {
	            sb.append(s + "\r\n");
	        }
	    } catch (Exception e) {
	        e.printStackTrace();
	    }
	    return sb.toString();
	}

加载中
0
francis-x
francis-x

我用的是正常的呀,你是用的Jsoup么?你给的代码应该是Java net API吧?

public class Main {

	public static void main(String[] args) throws IOException {
		Document jsoup = Jsoup.connect("http://sports.xinmin.cn/2013/10/27/22446248.html").get();
		System.out.println(jsoup.html());
	}

}

0
Ryan-瑞恩
Ryan-瑞恩
你把编码换成GBK试试。。。。。
0
francis-x
francis-x
直接使用你的代码也是正常能显示的。你检查下你的工程是不设置成其它编码了?我的工程是UTF-8
0
java_speed
java_speed
need to set the char-set  in the response 
0
仪山湖
仪山湖
看看我以前写的一个博客,http://www.oschina.net/question/564772_124359
0
enzozhong
enzozhong
编码不对。。。
0
bosscheng
bosscheng
各个地方的编码是否都是设置为utf8 编码?
0
8446666
8446666

换成GBK肯定好使:http://www.sojson.com/blog/225.html

或者看这里:http://www.sojson.com/tag_jsoup.html

返回顶部
顶部