XML文件中包含HTML代码,如何提取出xml中的非法字符"&"和"<"?

洪云 发布于 2013/08/24 18:03
阅读 2K+
收藏 0
<?xml version="1.0" encoding="utf-8" ?>
<load>
    <html>
    <head>
    <meta http-equiv="Content-Type" content="text/html;charset=utf-8" />
    <title>strftime</title>    
    </head>
    <body>
    <p>date_default_timezone_set</p>
    <p>&amp;nbsp;</p>
    <p>set_time_limit()</p>
    <p></p>
    <p>xml_set_element_handler()</p>
    <p>a></p>
    <p>b&lt;</p>
    <p>strftime&lt;<xml_set_element_handler()>></p>
    </body>
    </html>

</load>

--------------------------------------------------------------------------------------------------

如何从上述xml文件中提取出xml文件中的非法字符"&"和"<"?关键是提取出"<"。要提取的"<"需要将<load>、<p>、</p>等标签中的"<"排除,只提取在类似<xml_set_element_handler()>位置的"<"。急盼赐教!

加载中
0
TrulyBelieve
TrulyBelieve

xml里嵌html,为嘛不用CDATA?

<?xml version="1.0" encoding="utf-8" ?> 
<load>
<![CDATA[

html代码

]]></load>

洪云
我不知道这个知识点啊。非常感谢赐教!
返回顶部
顶部