如何获取html中的文本

jokco 发布于 2014/09/03 10:31
阅读 3K+
收藏 0
<html> 
<head>  
        <meta http-equiv="Content-Type" content="text/html; charset=UTF-8">  
        <title>Dom遍历</title>  
    </head>  
    <body> 

           ####1

        <div id="frm0">  
           ####2
        <div id="frm1">  
            ####3
        <div id="frm2">  
    
        </div>  
            ####4
        </div>  
    
        </div>  
    </body>  
</html>



将####1、2、3、4...这些位置的文本单独提取出来,javascript可以么,或者有什么其他语言解析库支持



加载中
0
大喵哥
大喵哥
正则表达式 去掉html标签
0
Midnight
Midnight

$(‘body’).text() 会提取出全部

如果dom有规律的话你可以遍历分别提取

0
jhonephone
jhonephone

java库jsoup不是可以解析html吗?jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。

暗影风暴
暗影风暴
jsoup可以单独解析,有类似javascript的方法获取节点数据,很易用,建议使用
jokco
jokco
该评论暂时无法显示,详情咨询 QQ 群:点此入群
0
The-duke
The-duke
得到全部的内容,用正则去掉html标签。。。
0
jhonephone
jhonephone
jsoup提供了传统的DOM 方式的元素解析,下面是个例子:
File input = new File("D:/test.html");
Document doc = Jsoup.parse(input, "UTF-8","网址/");
Element content =doc.getElementById("content");
Elements links = content.getElementsByTag("a");
for (Element link : links) {
String linkHref =link.attr("href");
String linkText =link.text();
}
jokco
jokco
能不能根据节点获取其xpath和csspath
0
jokco
jokco
能不能根据节点获取其xpath和csspath,最好是不用java的,好像jquery可以
jokco
jokco
看来只能自己遍历拼接
0
乾坤摄
乾坤摄
先获得 from0 的 删掉 from0 在获得 from1 的 删掉 from1  将 from2 替换 成特殊字符 , 获得 body 下的 字符,用 特殊字符 分割
乾坤摄
乾坤摄
用 jquery 比较好办到。。。
0
Cobbage
Cobbage
html解析的类库。htmlparser等等
0
喜欢辣
喜欢辣
该评论暂时无法显示,详情咨询 QQ 群:点此入群
0
__loong
__loong
最简单的办法是 在不影响布局的情况下加两个标签 用jquery
OSCHINA
登录后可查看更多优质内容
返回顶部
顶部
返回顶部
顶部