如何过滤掉<script type="text/javascript">……</script>之间的文本

hebeijpp 发布于 2011/09/13 11:32
阅读 1K+
收藏 0
提取网页文本, 使用 HTMLParser 过可以滤掉 HTML 中的 script 和 style 内容,但是不知道怎莫过滤掉<script type="text/javascript">……</script>之间的文本,请指教
加载中
0
鉴客
鉴客
这个代码对 <script type=...> 同样有效
0
hebeijpp
hebeijpp

这位仁兄对这篇网页试试http://book.douban.com/subject/1231490/

怎么我的不可以呀

0
hebeijpp
hebeijpp
可能是<script type="text/javascript">……</script>之间的文本可能太长过滤不掉,怎么办呀?
0
konakona
konakona

http://bbs.phpchina.com/viewthread.php?tid=222353&rpid=1895332&ordertype=0&page=1#pid1895332

 

第五楼有源代码

0
loyal
loyal

???

正则?replaceall掉?

0
lxbzmy
lxbzmy
jsoup 可行否?
Andre.Z
Andre.Z
肯定行。
0
hebeijpp
hebeijpp
顶!!!jousp太强大了,莫名其妙的就好了。谢谢各位先辈了!
返回顶部
顶部