我有一个关于匹配html中字符串的问题,可否帮我看一下

DataPrince 发布于 2017/04/03 12:17
阅读 104
收藏 0

@喝酒不抽烟 你好,想跟你请教个问题:我想把图片中第一列和第二列对应的名字匹配起来,如图,第一列一个名字对应后面好多名字,最终的目的是想要达到:右边的一个人名有几个左边的名字与其对应

 

这是我截图的网页,如果可以,我把html文件发给你

加载中
0
南寻
南寻
待会我给你看下哈,,在吃饭
DataPrince
DataPrince
回复@喝酒不抽烟 : 我的邮箱18865387930@163.com,你可以随便给我发下,我就知道你邮箱了
DataPrince
DataPrince
回复@喝酒不抽烟 : 我也刚才出去吃饭了,你的邮箱多少,我把html文件发给你
0
南寻
南寻

额,,没看懂啥意思

DataPrince
DataPrince
需要把html发给你,光说你看不到代码,不好分析吧
DataPrince
DataPrince
回复@喝酒不抽烟 : 那我把源文件发给你,再给你解释一下
0
DataPrince
DataPrince

需要把红圈中的信息提取出来,现在是一个product类型对应很多enabled users,等把这些信息提取出来后,需要让一个enabled users 对应几个(1个,2个或者更多,看它有几个就对应几个)product。

 

0
南寻
南寻

那你先把所有的user,所有的product,所有的product-user(1对多),都拿出来,然后对product-user进行校验,如果一个product里面有user那就把这个product加到这个user里

DataPrince
DataPrince
回复@喝酒不抽烟 : 我主要卡在正则写不出来,不知道还有没有其他把办法,打听到可以用xpath,我还在看xpath语法,你可以写正则吗
0
南寻
南寻

额,,我觉得你还不如花时间学下正则,,很容易的,半天就差不多了,我感觉

DataPrince
DataPrince
@喝酒不抽烟 回复@喝酒不抽烟 : 现在困扰在爬虫阶段了,我那个问题你能不能把信息提取出来
南寻
南寻
回复 @金樽清酒斗十千 : 先学基础语法,然后爬虫,然后web端开发
DataPrince
DataPrince
@喝酒不抽烟 回复@喝酒不抽烟 : python你如何入行的啊,我现在做etl感觉市场太小了,所以在入门python,很吃力啊,有什么经验需要传授吗
南寻
南寻
回复 @金樽清酒斗十千 : 现在大数据最主流的是使用java进行开发
DataPrince
DataPrince
@喝酒不抽烟 回复@喝酒不抽烟 : 大数据用到python比较多吧?大数据需要准备什么,如果换的话,是换工作还是先自学,我也准备python相关,然后大数据
下一页
0
南寻
南寻
我现在没时间呢,,太忙了
DataPrince
DataPrince
回复@喝酒不抽烟 : 现在用xpath有点头绪,但是本地html的地址如何写你呢,我这样写的:C://Users//Administrator//Desktop//userInfo.html,一直有错,随便给个http的网址给它,就可以跑起来
0
Feng_Yu
Feng_Yu

这玩意用正则简直折磨人,xpath简单到爆,为毛你就是不愿意花时间去学一下?http://zvon.org/xxl/XPathTutorial/General/examples.html

DataPrince
DataPrince
@Feng_Yu 回复@Feng_Yu :这个办法可以,已解决,谢谢,file open不知道怎么用,以前不用scrapy的时候用的file open ,刚用框架,那种办法一用就报错,学的太少了,还需要学习
Feng_Yu
Feng_Yu
回复 @金樽清酒斗十千 : 你也可以用file open的方式,把文本流传递给解析方法去解析
Feng_Yu
Feng_Yu
回复 @金樽清酒斗十千 : 简单,你把本地页面用浏览器打开,看看地址栏是啥
DataPrince
DataPrince
现在用xpath有点头绪,但是本地html的地址如何写你呢,我这样写的:C://Users//Administrator//Desktop//userInfo.html,一直有错,随便给个http的网址给它,就可以跑起来.
返回顶部
顶部