Jsoup怎么解析页面中的示例代码

tinwai009 发布于 2018/02/02 11:14
阅读 290
收藏 0

Jsoup怎么解析页面中的示例代码

比如页面中有一段示例代码显示为:

<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-8">

抓取完还想显示成这样,但实际会把里面加上换行 空格和把半角双引号转为全角双引号等,怎么样能原样抓取下来呢,请高手指点,谢谢!

实际上要想的是像提取Cnblogs文章一样,里面有代码,也有文字,想原样提取出来,在别处显示也正常

加载中
0
天青色有雨
天青色有雨

我也很想知道,但是页面中的内容都是由css控制的,如何使用爬虫保存这些设置?额,好吧,可以解析下css,然后在解析格式,但是想起来就会觉得很麻烦,不实际

0
t
tinwai009

引用来自“何慕”的评论

我也很想知道,但是页面中的内容都是由css控制的,如何使用爬虫保存这些设置?额,好吧,可以解析下css,然后在解析格式,但是想起来就会觉得很麻烦,不实际

应该不用这样麻烦

返回顶部
顶部