请教一道python正则表达式的问题

计算改变生活 发布于 2013/05/27 16:41
阅读 172
收藏 0

假设字符串a = "任意字符<span class='title'><h3>米原康正的“一期一会”</h3></span>任意字符"

想通过import re 模块中的findall() 将“米原康正的“一期一会””这个字符串提取出来,请问如何编写正则表达式?


加载中
0
不必在乎朕是谁
不必在乎朕是谁
pattern = r"<span class='title'><h3>(.*?)</h3></span>"
result = re.findall(pattern, string, re.I)
print result.groups()
大量的 html 解析推荐使用 beautifulsoup 库。
0
依燃飯忒稀
依燃飯忒稀

python2.6.5

#!/usr/bin/python

#-*-coding:utf-8-*-
import re
a = "任意字符<span class='title'><h3>米原康正的“一期一会”</h3></span>任意字符"
pattern = r"<span class='title'><h3>(.*?)</h3></span>"
result = re.findall(pattern, a,re.I)
for item in result:
  print item
0
加酸
加酸

python 2.7

import re

result = re.findall("<span class='title'><h3>([\s\S]*?)</h3></span>",html)

0
加酸
加酸
这么简单直接匹配就ok  不要用  beautifulsoup 库。
返回顶部
顶部