关于就jsoup的使用!急求高手解答!

仲少 发布于 2013/08/19 17:00
阅读 427
收藏 0
<html>

<head>
<meta http-equiv=Content-Type content="text/html; charset=x-cp20936">
<meta name=Generator content="Microsoft Word 11 (filtered)">
<title>题目</title>
<style>
<!--
 /* Font Definitions */
 @font-face
	{font-family:宋体;
	panose-1:2 1 6 0 3 1 1 1 1 1;}
@font-face
	{font-family:"\@宋体";
	panose-1:2 1 6 0 3 1 1 1 1 1;}
 /* Style Definitions */
 p.MsoNormal, li.MsoNormal, div.MsoNormal
	{margin:0cm;
	margin-bottom:.0001pt;
	text-align:justify;
	text-justify:inter-ideograph;
	font-size:10.5pt;
	font-family:"Times New Roman";}
h1
	{margin-top:17.0pt;
	margin-right:0cm;
	margin-bottom:16.5pt;
	margin-left:0cm;
	text-align:justify;
	text-justify:inter-ideograph;
	line-height:240%;
	page-break-after:avoid;
	font-size:22.0pt;
	font-family:"Times New Roman";}
p.MsoHeader, li.MsoHeader, div.MsoHeader
	{margin:0cm;
	margin-bottom:.0001pt;
	text-align:justify;
	text-justify:inter-ideograph;
	layout-grid-mode:char;
	border:none;
	padding:0cm;
	font-size:9.0pt;
	font-family:"Times New Roman";}
p.MsoFooter, li.MsoFooter, div.MsoFooter
	{margin:0cm;
	margin-bottom:.0001pt;
	layout-grid-mode:char;
	font-size:9.0pt;
	font-family:"Times New Roman";}
p.Title, li.Title, div.Title
	{margin:0cm;
	margin-bottom:.0001pt;
	text-align:justify;
	text-justify:inter-ideograph;
	font-size:10.5pt;
	font-family:"Times New Roman";
	font-weight:bold;}
p.answer, li.answer, div.answer
	{margin:0cm;
	margin-bottom:.0001pt;
	text-align:justify;
	text-justify:inter-ideograph;
	font-size:10.5pt;
	font-family:"Times New Roman";
	font-weight:bold;}
p.Title0, li.Title0, div.Title0
	{margin:0cm;
	margin-bottom:.0001pt;
	text-align:justify;
	text-justify:inter-ideograph;
	font-size:16.0pt;
	font-family:"Times New Roman";
	color:red;
	font-weight:bold;}
p.answer0, li.answer0, div.answer0
	{margin:0cm;
	margin-bottom:.0001pt;
	text-align:justify;
	text-justify:inter-ideograph;
	font-size:14.0pt;
	font-family:"Times New Roman";
	color:blue;
	font-weight:bold;}
 /* Page Definitions */
 @page Section1
	{size:595.3pt 841.9pt;
	margin:72.0pt 90.0pt 72.0pt 90.0pt;
	layout-grid:15.6pt;}
div.Section1
	{page:Section1;}
-->
</style>

</head>

<body bgcolor=white lang=ZH-CN style='text-justify-trim:punctuation'>

<div class=Section1 style='layout-grid:15.6pt'>

<p class=Title0><span style='font-family:宋体'>题目</span></p>

<p class=answer0><span style='font-family:宋体'>答案</span></p>

</div>

</body>

</html>

以下是问题补充:

@仲少:怎么通过jsoup获取代码中的题目和答案信息? (2013/08/19 17:00)
加载中
1
liuleidefeng
liuleidefeng
关于对不对,首先一点儿你自己都可以验证,你跑一遍程序什么都清楚了。不懂多问是好的,但是自己也是要动脑筋的,要不然进步会很慢……
仲少
仲少
嗯!刚刚开始学习java所以很多东西还只是学习阶段,还不是很懂!
0
胡小翔
胡小翔

Document doc = Jsoup.parse("html内容");
String title = doc.select("div.Section1 p.Title0").text();
String answer = doc.select("div.Section1 p.answer0").text();
仲少
仲少
那实现这个的类该怎么写呢?能帮忙看一下?
0
震秦
震秦

题目: Jsoup.parse(html).select(".Title0").get(0).text()

答案类似. 

仲少
仲少
回复 @震秦 : 哈哈。。。初学者,不是很懂!真是有劳了!
震秦
震秦
回复 @仲少 : 你, 我真是服了。
仲少
仲少
那实现这个的类该怎么写呢?
0
仲少
仲少

引用来自“胡小翔”的答案


Document doc = Jsoup.parse("html内容");
String title = doc.select("div.Section1 p.Title0").text();
String answer = doc.select("div.Section1 p.answer0").text();
import java.io.IOException;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
public class TestJsoup {
public static void main(String[] args) throws IOException {
Document doc = Jsoup.parse("html内容");
String title = doc.select("div.Section1 p.Title0").text();
String answer = doc.select("div.Section1 p.answer0").text();
}

}

那实现这个的类是这么写吗?还是哪里需要改呢?

0
胡小翔
胡小翔

引用来自“仲少”的答案

引用来自“胡小翔”的答案


Document doc = Jsoup.parse("html内容");
String title = doc.select("div.Section1 p.Title0").text();
String answer = doc.select("div.Section1 p.answer0").text();
import java.io.IOException;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
public class TestJsoup {
public static void main(String[] args) throws IOException {
Document doc = Jsoup.parse("html内容");
String title = doc.select("div.Section1 p.Title0").text();
String answer = doc.select("div.Section1 p.answer0").text();
}

}

那实现这个的类是这么写吗?还是哪里需要改呢?

"html内容",就是你上面的这个html文档读取出来的字符串
仲少
仲少
回复 @kidbei : 嗯,谢谢你的指导,其实我这个html页面显示的就是“题目”和“答案”,因为最近老师要求去解析html文档,获取文档中的需要的信息,所以自己先弄一个简单的页面试试!能帮忙看一下把这个类完善一下吗?
kidbei
kidbei
回复 @仲少 :“HTML内容”是你上面那个html文件转成字符串后的内容,你可以提交http请求访问这个html页面,然后转成字符串, 个人觉得现阶段应该学好java基础....绝没有嘲讽LZ的意思,因为你这样学起来会很吃力,渐渐会丧失兴趣。
仲少
仲少
那这个类哪里还需要做什么更改吗?
0
kidbei
kidbei
回复 @仲少 : 这个类没有要完善的啊,就是需要将你上面的html页面转成字符串就行了,如果你上面的页面是线上的,那么你需要用Jsoup.connect()方法访问这个html的链接,得到字符串后就是下面的代码了,如果你的这个Html页面是本地的一个html文件,那就用java的IO流读取这个文件的内容,同样也是得到一个字符串。传入你下面的Document doc = Jsoup.parse()方法里面
0
仲少
仲少

引用来自“kidbei”的答案

回复 @仲少 : 这个类没有要完善的啊,就是需要将你上面的html页面转成字符串就行了,如果你上面的页面是线上的,那么你需要用Jsoup.connect()方法访问这个html的链接,得到字符串后就是下面的代码了,如果你的这个Html页面是本地的一个html文件,那就用java的IO流读取这个文件的内容,同样也是得到一个字符串。传入你下面的Document doc = Jsoup.parse()方法里面
import java.io.File;
import java.io.IOException;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
public class TestJsoup {
public static void main(String[] args) throws IOException {
File input = new File("D:\\text.txt");          
Document doc = Jsoup.parse("题目");
String title = doc.select("div.Section1 p.Title0").text();
String answer = doc.select("div.Section1 p.answer0").text();
System.out.println(doc);
}

}

那你看一下我这个对吗?我对刚刚那个类改了一下!

0
月光小南
月光小南
红薯诱骗文章,看了就懂了大半了。。
仲少
仲少
回复 @月光小南 : 嗯!谢谢!!
月光小南
月光小南
回复 @仲少 : 搜索可以帮你,这个很容易找到的。。。http://www.oschina.net/question/12_14127
仲少
仲少
在哪里可以找到啊?
0
南湖船老大
南湖船老大
不能这么懒和不思考,不能丢了我们Javaer的脸
仲少
仲少
呵呵。。。因为目前还是个初学者,所以还有很多东西要学!
返回顶部
顶部