Jsoup解析Html 获取内容为中文包含空格 空格出现乱码 ??怎么办?

Moy 发布于 2013/05/17 17:11
阅读 3K+
收藏 0

【开源中国 APP 全新上线】“动弹” 回归、集成大模型对话、畅读技术报告”

利用Jsoup 解析HTML文本 Document docu = Jsoup.parse(entity.getContent(), "gb2312", ""); 这里采用的编码是gb2312  这个网站的页面编码也是gb2312.  控制台能正常输出截取的中文 空格也能正常显示 ,输出到页面的时候空格出现乱码  ?? 怎么办?


加载中
0
Beyond-Bit
Beyond-Bit
你的页面采用的编码格式要和你这里设置一致
0
sjunjun
sjunjun
解决乱码问题,就是保持所有的编码一致.我选择的是utf8,不只是页面编码,连文件编码,浏览器编码都要一致.
Moy
Moy
谢谢
0
tiaowu
tiaowu
 解析出来会是乱码。这个好像是通过.replaceAll(Jsoup.parse(" ").text(),
" ")实现替换的
OSCHINA
登录后可查看更多优质内容
返回顶部
顶部