用bufferedReader读取网页源代码

struts_hibernate_spr 发布于 2013/12/30 15:21
阅读 177
收藏 0
各位大神&大婶,我现在要读取一个纯英文的页面,用的是bufferReader,可是解析出来全是乱码,换了好几种编码格式,utf-8,iso8859-1,gbk,gb2312都用了,不过读出来全是乱码,请问这是什么个原因啊?急求各位大神指点。。。。。,代码如下:
URL u = new URL(url);
HttpURLConnection conn = (HttpURLConnection)u.openConnection();
BufferedReader br = new BufferedReader(new 
                         InputStreamReader(conn.getInputStream(),"utf-8"));
StringBuffer sb= new StringBuffer();
String line = null;
while((line = br.readLine())!=null){
    sb.append(line+"\n");
}//end while
conn.disconnect();
page=sb.toString();
网页在这:http://statutes.agc.gov.sg/aol/browse/yearResults.w3p;type=actsSup;year=2006
加载中
返回顶部
顶部