鱼C论坛

 找回密码
 立即注册
查看: 2987|回复: 6

关于字节的问题

[复制链接]
发表于 2019-7-27 15:46:46 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
求助,据所了解,中文是两个字节,数字和符号是一个字节
今天自己做测试,TXT文件内容为“1234用于测试的。。。。”

>>> f = open("123.txt")
>>> f.tell()
0
# 返回指针位置
>>> f.read()
'1234用于测试的\n55测试使用\n666'
# 读取全部文件
>>> f.seek(0,0)
0
# 返回文件起始位置
>>> f.read(5)
'1234用'
# 读取5个字符
>>> f.tell()
7

按理说,4个数字+1个中文,返回不是6么?为什么测试返回的字节是7呢?
后来我又做了测试
>>> f.seek(0,0)
0
>>> f.read(2)
'12'
>>> f.tell()
2                        #  2个数字,返回2个字节
>>> f.read(1)
'3'
>>> f.tell()
3                        #  3个数字,返回3个字节
>>> f.read(1)
'4'
>>> f.tell()
5                      #  4个数字,返回5个字节


百度搜了半天没明白原因,请大神帮忙解释一下
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2019-7-27 16:07:45 | 显示全部楼层
本帖最后由 jackz007 于 2019-7-27 16:18 编辑
f = open('123.txt')
print(f . read(5))
print(f . tell())
f . seek(0 , 0)
print(f . read(6))
print(f . tell())
f . close()

    运行实况
C:\Bin>python x.py
1234
5
1234用
6

C:\Bin>

      没有任何问题呀。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-7-27 16:16:23 | 显示全部楼层
根据查看python的help函数,read(n)是读取n个字符,这里一个汉字算一个字符。tell()返回当前位置,这里是按byte算的,所以一个汉字算2个byte。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2019-7-27 17:02:17 | 显示全部楼层

tell()返回的是指针位置的字节,你看你运行的第二和第三行,第二行是4个数字,返回的字节是5,我就是在质疑这个。。。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2019-7-27 17:03:50 | 显示全部楼层
冬雪雪冬 发表于 2019-7-27 16:16
根据查看python的help函数,read(n)是读取n个字符,这里一个汉字算一个字符。tell()返回当前位置,这里是按 ...

中文字符是2个字节这个我知道的
我很疑惑的是,我通过read()读取的内容是“1234”
按理说,一个数字是一个字节,
读取的1234,不是应该返回字节4么,为啥返回的是5啊
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-7-27 17:09:07 | 显示全部楼层
wangxinnan 发表于 2019-7-27 17:03
中文字符是2个字节这个我知道的
我很疑惑的是,我通过read()读取的内容是“1234”
按理说,一个数字 ...

我这里是4呀。
>>> f.seek(0,0)
0
>>> f.read(4)
'asd1'
>>> f.tell()
4
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-7-29 13:46:11 | 显示全部楼层
python中文utf8编码后占3位,Unicode汉字为2个字节
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-1-13 02:49

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表