求一个抓取网页JavaScript代码的正则。

施健 发布于 2012/02/23 15:31
阅读 922
收藏 1

在VC的程序中需要抓取网页里JavaScript,求大神帮忙给一个吧。下面是在网上找到的,不知道能不能改改用。
 
抓取HTML中CSS里背景图片地址
preg_match_all('/(background|background-image):url/([/"/']?([^/)]+)[/"/']?/)/i', $content, $tmparray);
 
抓取HTML中图片标签中的地址
preg_match_all('/<img[^>]+src=[/"/']{1}([^/"/'/s]+)[/"/']{1}[^>]+>/i', $content, $tmparray);
 
抓取HTML中图片背景地址
preg_match_all('/background=[/"/']?([^/"/'/s>]+)[/"/']?/i', $content, $tmparray);
 
抓取HTML中的Flash地址
preg_match_all('/<embed[^>]+src=[/"/']{1}(([^/"/'/s]+)/.swf)[/"/']{1}[^>]+>/i', $content, $tmparray);

抓取HTML中的iframe的链接地址
preg_match_all('/<iframe[^>]+src=[/"/']?([/w/-///.]+)[/"/']?[^>]+><//iframe>/i', $content, $tmparray);
 
抓取HTML中的超链接地址
preg_match_all('/<a[^>]+href=[/"/']{1}([^>/"/']+)[/"/']?[^>]+>([^<]+)<//a>/i', $content, $iframeurlarray);
 
以上分别为CSS背景图片、图片标签、图片背景、FLASH地址、IFRAME地址、超链接地址 的抓起正则。

加载中
0
leo108
leo108
<script[^>]*?>([\s\S]+?)</script>
0
施健

引用来自“leo108”的答案

<script[^>]*?>([\s\S]+?)</script>

谢谢帮忙,我拿去直接用了。

返回顶部
顶部