鱼C论坛

 找回密码
 立即注册
查看: 2317|回复: 2

[技术交流] Python memoryview & bytearray 的用法

[复制链接]
发表于 2020-3-16 15:43:32 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
本帖最后由 一个账号 于 2020-3-16 18:13 编辑

Python memoryview & bytearray 的用法


bytearray 是可变 (mutable) 的字节序列,相对于 Python2 中的 str,但 str 是不可变 (immutable) 的。

在 Python3 中由于 str 默认是 unicode 编码,所以只有通过 bytearray 才能按字节访问。

memoryview 为支持 buffer protocol[1,2] 的对象提供了按字节的内存访问接口,好处是不会有内存拷贝。

默认 str 和 bytearray 支持 buffer procotol。

下面两种行为的对比:

简单点就是,str 和 bytearray 的切片操作会产生新的切片 str 和 bytearry 并拷贝数据,使用 memoryview 之后不会。

不使用 memoryview

  1. >> a = 'aaaaaa'
  2. >> b = a[:2]    # 会产生新的字符串

  3. >> a = bytearray('aaaaaa')
  4. >> b = a[:2]    # 会产生新的 bytearray
  5. >> b[:2] = 'bb' # 对b的改动不影响 a
  6. >> a
  7. bytearray(b'aaaaaa')
  8. >> b
  9. bytearray(b'bb')
复制代码


使用 memoryview

  1. >> a = 'aaaaaa'
  2. >> ma = memoryview(a)
  3. >> ma.readonly  # 只读的 memoryview
  4. True
  5. >> mb = ma[:2]  # 不会产生新的字符串

  6. >> a = bytearray('aaaaaa')
  7. >> ma = memoryview(a)
  8. >> ma.readonly  # 可写的memoryview
  9. False
  10. >> mb = ma[:2]      # 不会会产生新的 bytearray
  11. >> mb[:2] = 'bb'    # 对 mb 的改动就是对 ma 的改动
  12. >> mb.tobytes()
  13. 'bb'
  14. >> ma.tobytes()
  15. 'bbaaaa'
复制代码


我的使用场景是网络程序中 socket 接收和接收数据的解析:

使用 memoryview 之前的 sock 接收代码简化如下

  1. def read(size):
  2. ret = ''
  3. remain = size
  4. while True:
  5.     data = sock.recv(remain)
  6.     ret += data     # 这里不断会有新的 str 对象产生
  7.     if len(data) == remain:
  8.         break
  9.     remain -= len(data)
  10. return ret
复制代码


使用 meoryview 之后,避免了不断的字符串拼接和新对象的产生

  1. def read(size):
  2.     ret = memoryview(bytearray(size))
  3.     remain = size
  4.     while True:
  5.         data = sock.recv(remain)
  6.         length = len(data)
  7.         ret[size - remain: size - remain + length] = data
  8.         if len(data) == remain:
  9.             break
  10.         remain -= len(data)
  11.     return ret
复制代码


返回 memoryview 还有一个优点,在使用 struct 进行 unpack 解析时可以直接接收 memoryview 对象,非常高效(避免大的 str 进行分段解析时大量的切片操作)。

例如:

  1.     mv = memoryview('\x00\x01\x02\x00\x00\xff...')
  2.     type, len = struct.unpack('!BI', mv[:5])
  3.     ...
复制代码

评分

参与人数 1荣誉 +1 收起 理由
永恒的蓝色梦想 + 1

查看全部评分

小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2020-3-16 18:12:20 From FishC Mobile | 显示全部楼层
标题是不是少了个字母,memoryview
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-3-16 18:13:03 | 显示全部楼层
hrp 发表于 2020-3-16 18:12
标题是不是少了个字母,memoryview

感谢提醒!
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-6-8 18:31

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表