jQuery 获取唯一 Xpath 的扩展插件 jXpath

GPL
JavaScript 查看源码»
跨平台
2016-09-30
Chenk_C

jXpath

一个获取页面某元素在此页面上“唯一xpath”的jQuery插件。

缘由

使用python开发一个爬虫项目,一开始用的bs4,发现bs4中对同一级别的元素支持很差,无论xpath还是css选择器都不太好弄。
后来选择使用py lxml + xpath,毕竟这是最佳之选。可能是我寻找能力有问题,没有找到成熟的获取xpath的插件,或者找到的不太符合自己的需求。
比如Google chrome的F12、还有一个js插件(网络来源,已忘记出处),所以打算自己写一个,自己比较喜欢jQuery,就写了个简单的。

特别处

  • 可使用任意属性获取(与元素高亮冲突)

  • 指定id/class获取

  • id/class共存

  • 对于有些不规范的源码中table不包含tbody元素 而页面自动添加tbody元素的兼容

  • 自动获取元素在xpath规范下的index,比如

    //body/div[id="content"]/div[2]

插件方法

  • 获取xpath:getXpath
    参数

var defaults = {
    keepTbodys: false,    // 保留tbody与否
    isHightLight: true,    //  元素高亮
    mode: "id&class"  // any / id / class / id&class   /
    // 模式 any为任意属,与元素高亮冲突
    // 模式 id ,只元素自己或父元素有id且页面唯一才停止
    // 模式 class ,只元素自己或父元素有class且页面唯一才停止
    // 模式 id&class,可以是id_class等。。只要包含id/class就行,id和class只要唯一就停止搜索
};
  • 获取元素的xpath index:getXpathIndex
    无参

使用范例

var path = $(selector).jQueryGetXpath("getXpath", {
    keepTbodys: true,
    mode: 'id_class',
    isHightLight: true
    });
  • 为了防止点击链接跳转等事件,可以对a标签取消跳转、所有jquery的点击事件都可以进行屏蔽等操作

$('body *').unbind("click");$('body *').click(function (event) {
    var path = $(this).jQueryGetXpath("getXpath", {
        keepTbodys: false,
        mode: 'id_class',
        isHightLight: true
    });
    alert(path);() + 20);
    event.stopPropagation(); // 阻止冒泡
    return false;//阻断后续事件});

使用js验证xpath正确性(可能会出现不一致,但是xpath是正确的)

var path = $(selector).jQueryGetXpath("getXpath", {
    keepTbodys: true,
    mode: "idclass"});var headings = document.evaluate(path, document, null, XPathResult.ANY_TYPE, null);var thisHeading = headings.iterateNext();var xpathText = "";while (thisHeading) {
    xpathText += thisHeading.textContent + "\n";
    thisHeading = headings.iterateNext();}var jQueryText = $(selector).text();if (xpathText.trim() === jQueryText.trim()) {
    alert("校验通过:\n" + xpathText.trim());}else {
    alert("校验未通过:\n xpath:\n" + xpathText + "\n" + "jQuery:\n" + jQueryText);}
的码云指数为
超过 的项目
加载中

评论(0)

暂无评论

暂无资讯

暂无问答

Apache commons (Java常用工具包)简介

Apache Commons是一个非常有用的工具包,解决各种实际的通用问题,下面是一个简述表,详细信息访问http://jakarta.apache.org/commons/index.html BeanUtils Commons-BeanUtils 提供对 Java...

2012/02/04 16:40
1.2K
1
Mule ESB 学习笔记(8)

写之前的内容时,Mule刚刚3.0.1版本,很多官方文档还没有更新(尤其示例代码),维持在V2的状态。经过了一年多的时间,Mule社区版发展至了3.2版本,并且推出了Mule Studio可视化开发工具(当...

2012/02/07 20:36
2.4W
3
Apache Commons工具集简介

Commons BeanUtils http://jakarta.apache.org/commons/beanutils/index.html 说明:针对Bean的一个工具集。由于Bean往往是有一堆get和set组成,所以BeanUtils也是在此基础上进行一些包装。 ...

2009/05/08 00:19
2.9K
0
Apache Commons包简介

Components Description Latest Version Released BeanUtils 易于使用的包装在Java反射和内省API 1.9.2 2014-05-29 CLI 命令行参数解析 1.2 2009-03-19 Codec 一般的编码/解码算法(例如语音...

2015/01/15 11:45
352
0
Apache开源项目分类列表

分类 项目名 说明 开发语言 服务器 (共20) Apache HTTP Server 全球第一HTTP服务器 C/C++ Tomcat Java的Web服务器 Java James 邮件服务器 Java SpamAssassin 反垃圾邮件 C/C++ Perl Apach...

2009/05/08 00:19
4.8K
0
Apache java项目全介绍

Jakarta项目是ASF(The Apache Software Foundation)的一部分。 ASF是一个非赢利组织,她鼓励基于开放的软件许可下进行合作、注重实效的开发,并提供各个领域的高质量软件,她涉及到 Http服务...

2010/04/05 13:00
3K
1
Apache Commons 常用工具包

Apache Commons 常用工具包

2016/05/04 10:25
517
1
一篇关于apache commons类库的详解[转]

1.1. 开篇 在Java的世界,有很多(成千上万)开源的框架,有成功的,也有不那么成功的,有声名显赫的,也有默默无闻的。在我看来,成功而默默无闻的那些框架值得我们格外的尊敬和关注,Jakar...

2018/04/18 09:41
3
0
apache-configuration详解

![输入图片说明](https://static.oschina.net/uploads/img/201611/07180047_j3p4.jpg "在这里输入图片标题") https://my.oschina.net/jack230230/blog/57171 ``` PropertiesConfiguration c...

2016/11/07 17:54
155
0
用JSP写出猜数字的游戏,详解!

常能见到一款经典的益智游戏——猜数字。假定C为游戏主持者,M为玩家,过程是这样的: C任意选取4个不重复的数字(0-9),并以任意次序组成一个串; M开始猜测这4个数字,同样给出不重复且有次...

2011/10/02 21:11
2.6K
0

没有更多内容

加载失败,请刷新页面

返回顶部
顶部