求提取网页源代码中URL的正则表达式

qinuxman 发布于 2013/03/01 09:59
阅读 710
收藏 0

我这里有两个:

"\"[hH][tT]{2}[pP]\\:/{2}.*?(\")" 

用来获取如http://www.neusoft.com/...这样的URL。
"\"[hH][tT]{2}[pP]\\:/{2}.*?(?=((/)|(\")|(\\:)))"  

用来获取如www.neusoft.com这样的URL。


但是应该不全,还有别的类型的

加载中
0
kiwivip
kiwivip
这种的应该有成熟的模块吧~别人早就把各种异常情况都考虑好了,你自己写100%会遗漏情况的~
qinuxman
qinuxman
嗯……可是我没找到……
返回顶部
顶部