Python使用urllib读取网页的问题

thinking空 发布于 2014/11/10 21:26
阅读 694
收藏 0
page= urllib.urlopen('http://www.baidu.com/')  
for line in page.readlines(): 
    if(条件):break

想问一下,page.readlines()这个函数有没有个内部计数器,让我知道读取到哪一行了?

page共多少行怎么获取?






加载中
0
梁小刚
梁小刚
page= urllib.urlopen('http://www.baidu.com/').readlines()
print len(page)



1
22too
22too
其实我不会告诉你,你这样写是没有用的,因为只有一行,你可以去看看
0
thinking空
thinking空
我是想读取一部分网页,然后判断网页使用的编码,不能一行一行的读取吗?
thinking空
thinking空
回复 @PYPlus : 谢谢,正在看
PYPlus
PYPlus
回复 @wo190810401 : 是的Python的requests库比自带的好用
22too
22too
python requests 库,看看
0
雪梨苹果
雪梨苹果
一行一行读取就是用 readline(),用个while不断循环,知道读取为空时break就行了。
返回顶部
顶部