我上辈子是程序员么?我下辈子要做张折凳

sidney9111 发布于 2015/03/13 02:33
阅读 700
收藏 0

如果我上辈子不是程序员,我怎么可能写出这样的代码

到目前为止,一本Python书没看过,这个星期才开始写的Python

现在星期4,难道我梦游的时候,看过如何写python

# -*- coding:utf-8 -*-

#主要想把一整个网站抓下来,写了1天Scrapy后,发现无法抓动态页面,所以现在用了Ghost,结果才发现外链无法处理,修复中。。。,但我相信很多人都已经做过这个轮子,或者有其他更好的解决方案,开源更多是一种修炼,而很难论剑,更没可能称霸

from ghost import Ghost

class SiteReader:
    def read(self):
        ghost = Ghost()
        ghost.wait_timeout=200
        print("start load")
        site="http://www.stoneboke.com/1.0.0/src/abc.png"
        pre="http://www.stoneboke.com/"
        self.makedirs(site,pre)
        # page, resources = ghost.open('http://stoneboke.com/index.html')
        # if page.http_status!=200:
        # print('cant open site'+str(page.http_status))
        # return
        # print(page.http_status)
        # for res in resources:
        # print(res)
        # print(res.url)
        # print(res.http_status)
        # print(res.headers)

    def makedirs(self,site,pre):

       #makedirs生成1~n个目录,例如1.0.0/src/img/,实现代码省略。。。

       #如果文件头不加# -*- coding:utf-8 -*-,无法写母语备注




siteReader=SiteReader()

siteReader.read()


要注意缩进(哥读大学的时候从没想过会有今天如斯屌丝)

加载中
0
一只大熊猫
一只大熊猫

Python的强制缩进...还是Ruby看得习惯。

0
一觉泯恩仇
一觉泯恩仇
ruby还不是要begin和end的写法- -
0
泡泡丹丹
泡泡丹丹
完全看不懂啊。
0
梅开源
梅开源

我也在学python

很自然简洁的表达

0
notreami
notreami

好吧,没学过python,问题是,大眼一看,貌似是一个网页请求,然后各种打印网页信息。。。

0
sidney9111
sidney9111

引用来自“notreami”的评论

好吧,没学过python,问题是,大眼一看,貌似是一个网页请求,然后各种打印网页信息。。。

是的,昨晚搞到3点多,早上起来加了备注,现在应该大家能更看得懂了,python按我现在的理解,Python的语法就是一种比较需要严格规则的伪代码,对于我们这种老程序猿,统一规则胜于配置这类观点,好懂
0
sidney9111
sidney9111

再多说2句吧,很多人觉得各种打印网页信息什么用?我当然觉得hello world程序是毫无作用的

for res in resources:
        # print(res)
        # print(res.url)
        # print(res.http_status)
        # print(res.headers)

以上打印了一推,只是测试,

有用的只是res.url这个,取到这个值,蜘蛛就能继续爬了

然后就是 res.headers可以取到一些参数,让蜘蛛执行不一样的行为

当然你先得保证res.http_status==200,如果是其他status,你得做相应的错误处理

0
军师ives
你这辈子就可以做张折凳啊,学点木工活就行了。
0
sidney9111
sidney9111

引用来自“军师ives”的评论

你这辈子就可以做张折凳啊,学点木工活就行了。
这是白话,意思是我下辈子应该会投胎成为一个板凳(折凳是兵器排行榜第一的杀人武器,这辈子的做程序猿屈辱要下辈子发泄出来,大概有这种含义)
返回顶部
顶部