编码:就是,你用几个字节去理解内存中的数字。
解码:就是,将内存中的字节数组按照什么字符集解码成对应的字符 字符串按照不同的字符集编码encode返回字节序列bytes encode(encoding=‘utf-8’,errors=‘strict’)->bytes 注意encode默认转换时的默认编码集是utf-8 字节序列按照不同的字符集解码decode返回字符串 bytes.decode(encoding=‘utf-8’,errors=“strict”) -->strbytearray.decode(encoding=“utf-8”,errors=“strict”)–>str 注意:decode方法默认解码时,默认的编码集是utf-8 示例 1:a = 'abc'c = a.encode() #将abc字符串编码成字节数组d = c.decode() #将变量c的字节数组解码成对应的字符串print(a,c,d,sep="t") * 示例 2: encode()指定编码集 ````python a = '你好' a1 = a.encode(encoding="utf-8") # 用utf-8编码集将字符串a转换成对应的字节数组 a2 = a.encode(encoding="gbk") # 用gbk编码集将字符串a转换成对应的字节数组 a11 = a1.decode(encoding = "utf-8") #用utf-8编码集将字节序列a1转换成对应的字符(注意编码时和解码时的编码集要保持一致,不然会出现如下a12乱码) a12 = a1.decode(encoding = "gbk") print("a = {}na1 = {}na2 = {}na11 = {}na12 = {}".format(a,a1,a2,a11,a12)) ```` 常用ASCII数字对应的字符: 【t】–>9【n】–>10【r】–>13[0-9]–>[48-57] 在ASCII表中1对应的16进制表示法是31[A-Z]–>[65-90] 在ASCII表中A对应的16进制表示法是41[a-z]–>[97-122] 在ASCII表中a对应的16进制表示法是61 ASCII表 bytes bytes定义 【注意一个字节是8位,而bytes是字节数组】 bytes() #定义一个空的bytesbytes(int) #指定字节的bytes,被x00填充 例如:bytes(15)表示定义一个长度为15的字节组成的数组 bytes(iterable_of_ints) -->bytes[0,255]的int组成的可迭代对象
例如:arr = [61,62,63]arr2 = bytes(arr) # 根据int类型列表转换成对应的字节列表,注意列表中int类型的值取值范围是【0-255】arr3 = list(arr2) # 根据字节列表,将每个字符转换成对应的十进制数存放在新的list列表里面arr4 = arr2.hex() #将字节列表,转换成对应的16进制字符串print("arr = {}narr2 = {}narr3 = {}narr4 = {}".format(arr,arr2,arr3,arr4))
* bytes(string,encoding[,errors])–>bytes等价于string.encode(),将string字符集按照指定的编码表解码成对应的bytes集合。
* bytes(bytes_or_buffer)–>immutable copy of bytes_or_buffer从一个字节序列或者buffer复制出一个新的不可变的bytes对象
* 注意:当copy的序列中是python的常量时,在python底层不会真的去拷贝一份常量,只是增加常量的引用次数.因为bytes字节数组是不可变的。
* 例如:
python s = "年第三".encode() s1 = bytes(s) print(s,s1) print(id(s),id(s1))
大部分方法和str类似,都是不可变类型,所以方法很多都一样。只不过bytes方法,输入的是bytes输出的也是bytes
例如: replace(bytes,bytes) 替换字符 b’abcdef’.replace(b’f’,b’k’)将字节【abcdef】中的【f】替换成【k】 find(bytes) 寻找指定字符,找到返回对应索引,找不到返回-1 例如: decode() #将字节序列转换成字符序列bytes.fromhex(string) 类方法 #默认是两个字符表示一个16进制的数字转换成一个字符 注意:stirng必须是两个字符的16进制的形式,字符串中的空格将会被忽略bytes.fromhex(“6a6b 5d6d”)将16进制的数字转换成对应的二进制字符相关方法:hex() 返回16进制表示的字符串。例如:‘abc’.encode().hex()示例 num = "61 6263"num1 = bytes.fromhex(num) #将16进制的数字转换成对应的字节num2 = num1.hex() #将字节转换成对应的16进制字符串num3 = list(num1) #将字节转换成对应的10进制数,存放在新列表中print("num1 = {}n num2 = {} n num3 = {}".format(num1,num2,num3))
* 索引
b’abcdef’[2]返回该字节对应的数,int类型
注意:上述方法若需要使用int类型,值要在[0,255]clear()清空bytearrayreverse()翻转bytearray,就地修改 int和bytes int.from_bytes(bytes,byteorder) #将一个字节数组表示成整数。 需要指定模式 bytes为字节byteorder 为:【‘big’】或者【little】 大端模式(big) :低字节如果放在高地址上。叫大端模式小端模式(tittle):低字节如果放在低地址上,称为小端模式 int.to_bytes(length,byteorder) #将一个整数表达成指定长度的字节数组大小端图解
示例1:
示例2: a = "abc"a1 = a.encode() #将字符abc转出字节数组 默认编码方式是utf-8a2 = int.from_bytes(a1,"big") #将字节数组,用int数组表示法,使用大端模式转成int类型a3 = a2.to_bytes(3,"big") #将a2转换成字节数组,需要指定int类型的a2表示了几个字节,使用了什么模式a4 = a3.decode() #将字节数组解码,默认解码方式是utf-8print("a = {}na1 = {}na2 = {}na3 = {}na4 = {}".format(a,a1,a2,a3,a4)) 示例3,同一个字的不通编码 "啊".encode() # 编码 --->返回bytes encode()默认编码方式是utf-8"啊".encode(encoding='gbk') # 编码,指定编码方式为gbkord("啊") #解码(返回是10进制整数),获取“啊”的编码。由于python的默认编码时unicode所有获取的是对应unicode编码表的编码hex(21834) #将21834转换成16精制数