urllib2.urlopen(url).read()返回503错误

lich_king 发布于 2013/04/18 01:08
阅读 6K+
收藏 0

标题里的url复制粘贴到浏览器里是可以打开的,但是使用标题中的方法就会返回错误,错误如下所示:

Traceback (most recent call last):
  File "test.py", line 30, in <module>
    scanurl()
  File "test.py", line 13, in scanurl
    src = urllib2.urlopen(URL+str(i)).read()
  File "/usr/lib/python2.6/urllib2.py", line 126, in urlopen
    return _opener.open(url, data, timeout)
  File "/usr/lib/python2.6/urllib2.py", line 397, in open
    response = meth(req, response)
  File "/usr/lib/python2.6/urllib2.py", line 510, in http_response
    'http', request, response, code, msg, hdrs)
  File "/usr/lib/python2.6/urllib2.py", line 435, in error
    return self._call_chain(*args)
  File "/usr/lib/python2.6/urllib2.py", line 369, in _call_chain
    result = func(*args)
  File "/usr/lib/python2.6/urllib2.py", line 518, in http_error_default
    raise HTTPError(req.get_full_url(), code, msg, hdrs, fp)
urllib2.HTTPError: HTTP Error 503: Service Temporarily Unavailable
请问是怎么回事呀,谢谢了


加载中
0
F_L_F
F_L_F
估计对浏览器的headers等进行了判断了吧
lich_king
lich_king
那应该怎么处理呀??
0
用户名已存在
用户名已存在

User-agent 模拟一下浏览器的头

你可以用抓包工具把浏览器发的请求包捕获,然后自己模拟header

0
lich_king
lich_king
刚才模拟了一下,果然是这个问题,谢谢楼上两位了
a暗夜星辰a
a暗夜星辰a
麻烦请问一下,你是怎么解决的,我现在爬取信息,也遇到同样的错误,怎么模拟,我访问谷歌次数过多,他就拒绝访问了。您是怎么解决的呀
返回顶部
顶部