求助,jsoup解析html时的乱码问题

Mizuki1412 发布于 2012/07/25 22:42
阅读 4K+
收藏 0
String html = "<p>&nbsp;&nbsp;&nbsp;</p>";  
System.out.println(Jsoup.parse(html).text()); 

控制台输出为 ???
求助该如何解决??

以下是问题补充:

@Mizuki1412:谢谢,是编码问题 (2012/07/26 22:33)
加载中
0
小白小霸王
小白小霸王
开发环境问题,找找首选项能改成UTF-8的都改成UTF-8
MikeAfc宇
MikeAfc宇
我去,跪谢。。找了两个小时没找到办法。。。试了试还真是编译环境问题。。
0
gtd
gtd
我这边输出三个空格
0
樂
只要乱码就是编译器的编码问题,中文的一般都用UTF-8
0
抽象现实
抽象现实
怎么去掉这个空格呢?.trim() 去不掉
抽象现实
抽象现实
回复 @yingcj : 是的我就是这么解决的,肯定不是简单的乱码问题,因为别的汉字都没有事儿。 jsoup吧   换成了一个类似空格的符号,我们只需要把他替换掉就可以。
Mizuki1412
Mizuki1412
。。。晕, & nbsp ;
Mizuki1412
Mizuki1412
意思是去掉html中的“ ”字符串?
0
抽象现实
抽象现实

找到办法了

jsoup 把他&nbsp;替换了,但是不是替换成了普通的孔规格,那么直接使用replace替换就可以了

System.out.println(link.text().replace(Jsoup.parse("&nbsp;").text(), " "));

0
陈丙成
陈丙成

两个办法:

@抽象现实 的方法除外

这样:

System.out.println(Jsoup.parse(html.replace('&nbsp;','')).text());

0
8446666
8446666

请加载采用编码解决。或者笨方法替换即可。

其他乱码问题,采用编码,详情看这里:http://www.sojson.com/blog/225.html

返回顶部
顶部