Jsoup解析Html 获取内容为中文包含空格 空格出现乱码 ??怎么办?

Moy 发布于 2013/05/17 17:11
阅读 2K+
收藏 0

利用Jsoup 解析HTML文本 Document docu = Jsoup.parse(entity.getContent(), "gb2312", ""); 这里采用的编码是gb2312  这个网站的页面编码也是gb2312.  控制台能正常输出截取的中文 空格也能正常显示 ,输出到页面的时候空格出现乱码  ?? 怎么办?


加载中
0
Beyond-Bit
Beyond-Bit
你的页面采用的编码格式要和你这里设置一致
0
sjunjun
sjunjun
解决乱码问题,就是保持所有的编码一致.我选择的是utf8,不只是页面编码,连文件编码,浏览器编码都要一致.
Moy
Moy
谢谢
0
tiaowu
tiaowu
 解析出来会是乱码。这个好像是通过.replaceAll(Jsoup.parse(" ").text(),
" ")实现替换的
返回顶部
顶部