很多python初学者想问python字符串中,一个汉字占几个字节?那么小编就通过这个机会来给大家一个答案,如果感兴趣的小伙伴一定要耐心的看完小编给大家带来的知识。
在python中,字符汉字在utf-8编码下占三个字节,在gbk编码下占两个字节。
1、Python中汉字在utf-8编码下示例:
2、Python中汉字在gbk编码下示例:
UTF-8是Unicode的一种实现方式,也就是它的字节结构有特殊要求,所以我们说一个汉字的范围是0X4E00到0x9FA5,是指unicode值,至于放在utf-8的编码里去就是由三个字节来组织,所以可以看出unicode是给出一个字符的范围,定义了这个字是码值是多少,至于具体的实现方式可以有多种多样来实现。
GBK全称《汉字内码扩展规范》,GBK编码,是在GB2312-80标准基础上的内码扩展规范,使用了双字节编码方案,其编码范围从8140至FEFE(剔除xx7F),共23940个码位,共收录了21003个汉字,完全兼容GB2312-80标准。
以上就是小编给大家带来的在python中字符串一个汉字占几个字节的知识了,一般来说在utf-8编码下占三个,在gbk编码下占两个。如果阅读完之后觉得小编的文章不错的话可以多多支持我们优草派官网,以便了解更多相关知识。
客服热线:0731-85127885
违法和不良信息举报
举报电话:0731-85127885 举报邮箱:tousu@csai.cn
优草派 版权所有 © 2024