关于jsoup解析TXT中文乱码问题

郑志友 发布于 2011/01/14 10:51
阅读 5K+
收藏 1

 

我JSOUP代码:

URL url_1 = new URL(filepath);

Document text = Jsoup.parse(url_1,5*1000);

System.out.println(text.html());

请高人帮忙

以下是问题补充:

@tjm365:请问最后是怎么解决的,我现在遇到了同样的问题 (2012/06/04 15:26)
加载中
0
红薯
红薯

jsoup 不管编码的事情,自己要转码后再把内容传给jsoup

0
郑志友
郑志友

引用来自#2楼“红薯”的帖子

jsoup 不管编码的事情,自己要转码后再把内容传给jsoup

怎么转编码?JAVA不是很熟哦,我只是要做个工具,赐教

0
红薯
红薯

引用来自#3楼“郑志友”的帖子

引用来自#2楼“红薯”的帖子

jsoup 不管编码的事情,自己要转码后再把内容传给jsoup

怎么转编码?JAVA不是很熟哦,我只是要做个工具,赐教

不熟的话就别用java了,水很深的

0
郑志友
郑志友

android还能用其他的吗

这个应该就几行代码吧,我只是只要效果,其他的可以先缓下

0
xiaowenliang
xiaowenliang

引用来自#5楼“郑志友”的帖子

android还能用其他的吗

这个应该就几行代码吧,我只是只要效果,其他的可以先缓下

为什么你不尝试Google :  java 编码   或者    java file encoding    ?

学习一门技术,首先应该学着自己怎么解决问题吧 :P

0
郑志友
郑志友

找啦,没发现适合的,读取的是空

URL url_1 = new URL("http://files.qidian.com/Author3/1695698/29041829.txt");

     Document text = Jsoup.parse(url_1,5*1000);

    

     BufferedReader   in   =new BufferedReader(new InputStreamReader(url_1.openStream(),"utf-8"));  

     in.readLine();

     System.out.println(in.readLine());

代码也写了几年了,我知道怎么查资料,JAVA不熟,所以出点问题,总得找人问下嘛

0
baeeq
baeeq

引用来自#4楼“红薯”的帖子

引用来自#3楼“郑志友”的帖子

引用来自#2楼“红薯”的帖子

jsoup 不管编码的事情,自己要转码后再把内容传给jsoup

怎么转编码?JAVA不是很熟哦,我只是要做个工具,赐教

不熟的话就别用java了,水很深的

。。。。头一次说java水很深!哈哈!

jsoup1.3.2版之后的通过url获取Document的是处理编码的,但是如果是直接给内容文本字符串,肯定得自己处理!

0
郑志友
郑志友

我是这么处理,高手帮忙看看,还是得不出中文

URL url_1 = new URL("http://files.qidian.com/Author3/1695698/29041829.txt");

     Document text = Jsoup.parse(url_1,5*1000);

     BufferedReader   in   =new BufferedReader(new InputStreamReader(url_1.openStream(),"UTF-8"));  

     System.out.println(in.readLine());

0
红薯
红薯

引用来自#9楼“郑志友”的帖子

我是这么处理,高手帮忙看看,还是得不出中文

URL url_1 = new URL("http://files.qidian.com/Author3/1695698/29041829.txt");

     Document text = Jsoup.parse(url_1,5*1000);

     BufferedReader   in   =new BufferedReader(new InputStreamReader(url_1.openStream(),"UTF-8"));  

     System.out.println(in.readLine());

我试了,好像是对方网站做了处理了,只能用浏览器才能看到正常的,所以你要模拟浏览器的User-Agent

0
郑志友
郑志友

引用来自#10楼“红薯”的帖子

引用来自#9楼“郑志友”的帖子

我是这么处理,高手帮忙看看,还是得不出中文

URL url_1 = new URL("http://files.qidian.com/Author3/1695698/29041829.txt");

     Document text = Jsoup.parse(url_1,5*1000);

     BufferedReader   in   =new BufferedReader(new InputStreamReader(url_1.openStream(),"UTF-8"));  

     System.out.println(in.readLine());

我试了,好像是对方网站做了处理了,只能用浏览器才能看到正常的,所以你要模拟浏览器的User-Agent

能不能给点资料,或者是代码,关于模拟浏览器的User-Agent

返回顶部
顶部