求助 刚学python 学习爬虫

小良下山化了个缘 发布于 2017/12/20 16:23
阅读 93
收藏 0

【领华为电脑包】容器化时代到来!跳转机分配问题终于“有救”了!>>>

url = "http://www.douban.com/"
request = urllib.request.Request(url)
response = urllib.request.urlopen(request)
data = response.read()
print(data)
先上代码,网上的教程大多是python2的,我直接安装的是3.5,上述代码输出,
中文字符集不对,ad\x97\xe2\x80\x94\xe2\x80\x94\xe9\xbe\x99\xe7\x8c\xab\xe4\xb9\x90\xe9\x98\x9f\xe5\x8a\xa8\xe6\xbc\xab\xe9\x92\xa2\xe7\x90\xb4\xe6\xb5\xaa\xe6\xbc\xab\xe8\xa7\x86\xe5\x90\xac\xe6\x96\xb0\xe5\xb9\xb4\xe9\x9f\xb3\xe4\xb9\x90\xe4\xbc\x9a">\n \xe4\xbd\xa0\xe7\x9a\x84\xe5\x90\x8d\xe5\xad\x97\xe2\x80\
像这样
最后一句改成这样
print(data.decode('utf-8'))
有这样的报错
UnicodeEncodeError: 'gbk' codec can't encode character '\u2122' in position 43596: illegal multibyte sequence
求助,怎么解决?我看到关于python3的教程 他们输出都是正常的

加载中
0
随你疯
随你疯
改成gb2312试试
0
大洋的顶端
大洋的顶端
import urllib.request
url = "http://www.douban.com/"
request = urllib.request.Request(url)
response = urllib.request.urlopen(request)
data = response.read()
print(data.decode('utf-8'))

 

返回顶部
顶部