[1] 李广建,乔建忠.  <a target="_blank" href="/kcms/detail/detail.aspx?filename=QBLL201001027&dbcode=CJFQ&dbname=CJFD2010">全自动生成网页信息抽取包装器的主要技术方法研究</a>[J]. <a onclick="
 getKns55NaviLink('','CJFQ','CJFQbaseinfo','QBLL');
 ">情报理论与实践</a>.
<a onclick="
 getKns55NaviLinkIssue('','CJFQ','CJFQyearinfo','QBLL','2010','01')
 ">2010(01)
</a></li>
<li class="
 double
 ">
[2] 陈红叶.  <a target="_blank" href="/kcms/detail/detail.aspx?filename=WJFZ2003S2019&dbcode=CJFQ&dbname=CJFD2003">基于HTML和XML的信息提取方法研究</a>[J]. <a onclick="
 getKns55NaviLink('','CJFQ','CJFQbaseinfo','WJFZ');
 ">微机发展</a>.
<a onclick="
 getKns55NaviLinkIssue('','CJFQ','CJFQyearinfo','WJFZ','2003','S2')
 ">2003(S2)
这是一个网页的部分内容,我想提取其中的作者名,论文名,出处名和年份。应该怎么写正则?
这是一个网页的部分内容,我想提取其中的作者名,论文名,出处名和年份。应该怎么写正则?