utf8的网页为什么还有十六进制的字符呢?

socket 发布于 2013/10/29 21:15
阅读 341
收藏 0

在学校图书馆的网页:http://opac.lib.ustc.edu.cn/opac/top100.php

如上图所示,"verilog(31)" 在网页源码中是“verilog (31)

1.请问这是为什么啊?

2.请问怎么把它们转码成可读的utf8文字?

非常感谢~~

加载中
0
socket
socket
搞明白了~用python3的html.parser可以做到~哈哈哈
0
insights
insights
转义了所有的文字,可以避免有html语义的尖括号、引号等。
socket
socket
那这个怎么解码?
返回顶部
顶部