正则表达式能定位内容中<br />吗

非法沣 发布于 2017/04/04 21:56
阅读 135
收藏 0

<p>勐海陈升茶业有限公司(勐海陈升茶厂),位于云南省西双版纳州勐海县八公里工业区,占地150余亩的厂区,依山傍水,掩映在漫山遍野的茶园<br />古树和热带植物中,从西双版纳至勐海县的高速路上,远眺陈升公司那两条180米长的银白色厂房,恍若镶嵌在湛蓝天空下,翠绿青山中的一片祥云,熠熠闪亮……<br /></p>
<p>公司拥有被各界称道的一流硬件配套设施,建筑面积两万多平方米,整个厂区划分为生产、仓储、办公、生活和旅游等功能区。<br />企业由茶界知名大师主持产品研发,在充分发扬勐海独特制茶技艺和发酵工艺的同时,注重传统工艺和现代技术的融合,将确保茶原料的纯正品质和提高产品卫生标准视为企业生命保障,<br /></p>

<p>将陈升茶厂打造成“远看像公园,近看是花园”的生态企业,成功塑造了“陈升号”、“复原昌号”、“陈升精品”等品牌,产品品种涵盖普洱茶生、熟各系列。</p>“为天下人做喝得起的好茶”、“为爱茶人士做称道的好茶”是陈升茶业质朴的经营理念。<br /><p>
“把陈升号打造成中国最好的普洱茶品牌”是陈升茶人永不停息的追求!<br />陈升茶业正行走在从农业普洱、品牌普洱、科技普洱到文化普洱的发展之路上…</p>

}

如何通过正则表达式定位这段源代码的<br />

从第一个字符开始到第二个<br />为一个分段提取出来

第二个<br />到第三个分为一个内容提取出来

第四个<br />到所有内容结束分为一个内容

正则表达式可以实现这样的定位吗,要怎么写,有没有参考的

 

加载中
1
Lin_R
Lin_R
a = 'xxxx文本xxx'
re.findall(r'(.*?)<br />', a) # 不出意外可以获得一个结果集, 用for去一个个结果print出来
1
Feng_Yu
Feng_Yu

不建议用正则去做页面提取,十分难维护。强烈推荐xpath,专为解析标记类型文档而生

f
fdc2017
以后试试
0
yak
yak
print_r(explode('<br />',$data));

固定的值用expode更快

玖伍陈海天
玖伍陈海天
explode split 分割成数组再遍历挺好
玖伍陈海天
玖伍陈海天
支持使用分割。
返回顶部
顶部