ASCII: 美国人发明的,只编码英文字母和符号,1个字节。 GB2312: 中国人发明的,增加了中文汉字和符号,2个字节。 Unicode: 为了把所有语言都统一到一套编码里,一般是2个字节,生僻字4个字节。 UTF-8: 为了节省英文字符内存空间,UTF-8可变长编码,常用的英文字母被编码成1个字节,汉字通常是3个字节,生僻的字符编码...
使用Python 将中文转换为 GBK 编码 Python 提供了encode()函数用于将字符串转换为指定的编码格式。对于中文字符串,可以使用encode('gbk')将其转换为 GBK 编码的字节流。 以下是一个简单的示例: # 将中文字符串转换为 GBK 编码chinese_str="中文字符串"gbk_str=chinese_str.encode('gbk')print(gbk_str) 1. ...