关于爬虫的有关问题,如何使用htmparser

陆炜炜 发布于 2013/06/19 18:19
阅读 758
收藏 1

开源之夏第三届火热来袭,高校学生参与赢万元奖金!>>>

@黄亿华 你好,想跟你请教个问题:请问一下用htmlparser如何去掉网页中的标签后字符间不留空格啊,我去掉标签后打印出来有好多空格和回车,非常不好。

加载中
0
loyal
loyal
java直接用 jsoup 一句话搞定.
0
MeiKai
MeiKai
你可以用正则替换掉
0
cph_mvp
cph_mvp
正则是王道
0
北落
北落
htmparser 里边我记得空格也作为Dom的一项
OSCHINA
登录后可查看更多优质内容
返回顶部
顶部
返回顶部
顶部