1.uft8->unicode,使⽤decode()⽅法,⽅法默认使⽤“utf8”的编码。(可以理解为我现在指定磁盘上某个编码为uft8的⽂件去解码为unicode,,⽅便后续我的python解释器内尺存使⽤) 2.r,⽂本读取模式,即byte->str的转换,但是会遇到部分中⽂不能成功的情况,即上⾯的场景。 3.rb,...
原因很简单:XMLHTTP得到Response时假定Response是UTF8编码的,如果Response是XML,那还可以通过encoding来指定编码,但HTML就不行了。(见鬼的GB2312,再次打倒!)所以它把含GB2312编码的HTML当成UTF8格式,不出错才有鬼! 不过好在还有补救的办法:XMLHTTP的responseBody 属性里包含的可是未解码的Resonse——"a raw undecoded...
原因很简单:XMLHTTP得到Response时假定Response是UTF8编码的,如果Response是XML,那还可以通过encoding来指定编码,但HTML就不行了。(见鬼的GB2312,再次打倒!)所以它把含GB2312编码的HTML当成UTF8格式,不出错才有鬼! 不过好在还有补救的办法:XMLHTTP的responseBody 属性里包含的可是未解码的Resonse——"a raw undecoded...