1
回答
java 正则问题。。。
利用AWS快速构建适用于生产的无服务器应用程序,免费试用12个月>>>   
    public String Find(String html, String regex, int g) {
        Pattern p = Pattern.compile(regex, Pattern.DOTALL);
        Matcher m = p.matcher(html);
        StringBuilder sb = new StringBuilder();
        while (m.find()) {
            String tmp = g == 0 ? m.group() : m.group(g);
            sb.append(tmp.trim()).append("\n");
        }
        return sb.length() == 0 ? html : sb.toString();
    }

    String weburl = Find(html,"href=(.*?)mon",0);
    System.out.println (weburl);

提取到的结果

href=http://www.haodf.com/zhuanjiaguandian/chenxiaoly_537863636.htm  mon

href=http://www.haodf.com/zhuanjiaguandian/ahyutang_539056072.htm  mon

href=http://www.cnr.cn/allnews/201110/t20111024_508671392.html  mon

href=/ns?word=%BC%D7%BF%BA+cont:544965971&cl=1&tn=newstitle&rn=30><font color=#008000 size=1>2条相同新闻&gt;&gt;</a></font><br></span><br>

<span>&#8226;&nbsp;<a href=http://www.cnr.cn/allnews/201110/t20111024_508671395.html  mon

href=/ns?word=%BC%D7%BF%BA+cont:2563865815&cl=1&tn=newstitle&rn=30><font color=#008000 size=1>3条相同新闻&gt;&gt;</a></font><br></span>

<span>&#8226;&nbsp;<a href=http://roll.sohu.com/20111024/n323194212.shtml  mon

href=http://news.beelink.com.cn/20111024/2833748.shtml  mon

 

为什么 没有 mon 的记录也提取出来了呢

还有 <span>&#8226;&nbsp;

原字符串 里面有很多a连接

<a href=http://www.haodf.com/zhuanjiaguandian/ahyutang_539056072.htm  mon="a=5&pn=9"  target=_blank>

<a href=/ns?word=%BC%D7%BF%BA+cont:544965971&cl=1&tn=newstitle&rn=30>

但是有的连接没有 mon后面的

我要的正则是吧 带有 mon 的 a连接 的 href的地址提取出来

 

举报
cooc123
发帖于6年前 1回/165阅
顶部