鱼C论坛

 找回密码
 立即注册
查看: 2862|回复: 2

[已解决]29讲文件的相关问题求助

[复制链接]
发表于 2020-2-29 13:09:08 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
  1. f = open('E:\\pycharm\\测试\\record.txt','rb')
  2. boy=[]
  3. girl=[]
  4. count=1

  5. for each_line in f:
  6.     if each_line[:6]!='======':#字符串分割操作
  7.         (role,line_spoken)=each_line.split(':',1)
  8.         (role,line_spoken)=each_line.split(':',1)
  9.         if role=='小甲鱼':
  10.             boy.append(line_spoken)
  11.         if role=='小客服':
  12.             girl.append(line_spoken)
  13.     else:
  14.         file_name_boy = 'boy_'+str(count)+'.txt'
  15.         file_name_girl='girl_'+str(count)+'.txt'
  16.         boy_file = open(file_name_boy,'w')
  17.         girl_file=open(file_name_girl,'w')
  18.         boy_file.writelines(boy)
  19.         girl_file.writelines(girl)
  20.         boy_file.close()
  21.         girl_file.close()
  22.         boy=[]
  23.         girl=[]
  24. f.close()
复制代码

以上是代码
开始没有在open后面加‘rb’,会报错:UnicodeDecodeError: 'gbk' codec can't decode byte 0xae in position 4: illegal multibyte sequence
然后百度加入‘rb’可以解决,然后split就会报错:TypeError: a bytes-like object is required, not 'str'
文档里面的符号也都是英文的,求大神帮助
最佳答案
2020-2-29 13:17:00
本帖最后由 jackz007 于 2020-2-29 13:24 编辑

        这一句是完全错误的
  1. f = open('E:\\pycharm\\测试\\record.txt','rb')
复制代码

        虽然这样在读取文件的时候不会出现问题,但是,'rb' 代表二进制读,从文件中读取到的内容都会被当作字节码,而不是文本字符来对待,字节码只有在被成功解析后才能得到文本字符,所以,绝对不可以用 'rb' 选项。
        之前之所以不加 'rb' 会出错,多半是因为文本文件采用的不是 GBK 编码,而是 UTF-8 编码,导致在对字节码按照 GBK 编码进行解析的时候出现错误。所以,正确的选项应该是:
  1. f = open('E:\\pycharm\\测试\\record.txt' , encoding='UTF-8')
复制代码

        楼主不妨一试
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2020-2-29 13:17:00 | 显示全部楼层    本楼为最佳答案   
本帖最后由 jackz007 于 2020-2-29 13:24 编辑

        这一句是完全错误的
  1. f = open('E:\\pycharm\\测试\\record.txt','rb')
复制代码

        虽然这样在读取文件的时候不会出现问题,但是,'rb' 代表二进制读,从文件中读取到的内容都会被当作字节码,而不是文本字符来对待,字节码只有在被成功解析后才能得到文本字符,所以,绝对不可以用 'rb' 选项。
        之前之所以不加 'rb' 会出错,多半是因为文本文件采用的不是 GBK 编码,而是 UTF-8 编码,导致在对字节码按照 GBK 编码进行解析的时候出现错误。所以,正确的选项应该是:
  1. f = open('E:\\pycharm\\测试\\record.txt' , encoding='UTF-8')
复制代码

        楼主不妨一试
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-2-29 14:03:12 | 显示全部楼层
jackz007 发表于 2020-2-29 13:17
这一句是完全错误的

        虽然这样在读取文件的时候不会出现问题,但是,'rb' 代表二进制读 ...

原来如此,成功了,感谢感谢
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2026-3-1 18:25

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表