如何处理特殊字符【Python】

bbsyuewu 发布于 2012/11/24 22:11
阅读 3K+
收藏 0

想把html文件中无用的字符替换掉, 字符如:

ÄãÒª´Ó·þÎñÆ÷ÉÏ´ò¿ªËüÂð£¿

但是  复制   粘贴  后在编辑器中显示

??òa′ó·t???÷é?′ò?a?ü?e£?

和原来的字符串不同了     不知道怎么处理    希望有经验的高人  指点下   谢谢!

加载中
0
costaxu
costaxu

1 找到这些特殊字符的UNICODE编码

2 在PYTHON里将HTLM字符串转成UNICODE编码

3 用substitue或者其他的方法把这些特殊字符去掉

0
bbsyuewu
bbsyuewu

引用来自“costaxu”的答案

1 找到这些特殊字符的UNICODE编码

2 在PYTHON里将HTLM字符串转成UNICODE编码

3 用substitue或者其他的方法把这些特殊字符去掉

谢谢!
0
兵荒马乱
兵荒马乱
<meta http-equiv="Content-Type" content="text/html;charset=gb2312" /> 改一下编码试试
返回顶部
顶部