半夏冬青 发表于 2020-11-12 22:56:07

python 课程p30 的文件例子

f = open('record.txt')# 和python在同一目录下

boy=[]
girl=[]
count=1



for each_line in f:
    if each_line[:5] != '#####':   # 判断分割标志
      (role,lines_spoken) = each_line.split(':',1)   # 用字符串的split分成两部分
      if role == '小甲鱼':
            boy.append(lines_spoken)

      if role == '小客服':
            girl.append(lines_spoken)   #分别写入不同列表

    else:
      file_name_boy = 'boy' + str(count) +'.txt'
      file_name_girl = 'girl' + str(count) +'.txt'

      boy_file = open(file_name_boy,'w')
      girl_file = open(file_name_girl,'w')

      boy_file.writelines(boy)
      girl_file.writelines(girl)

      boy_file.close()
      girl_file.close()

      boy = []
      girl = []
      count += 1




f.close()

D:\python\python.exe D:/python/小甲鱼/p30/text.py
Traceback (most recent call last):
File "D:\python\小甲鱼\p30\text.py", line 9, in <module>
    for each_line in f:
UnicodeDecodeError: 'gbk' codec can't decode byte 0xae in position 6: illegal multibyte sequence

这个错误是怎么回事呢?
呜呜 和小甲鱼写的一摸一样的呀~


冬雪雪冬 发表于 2020-11-12 23:02:12

编码问题,把
f = open('record.txt')
改成

f = open('record.txt', encoding = 'utf-8')
试试

昨非 发表于 2020-11-12 23:05:24

23,24行有改动,同时加了些注释,希望有帮助

"""
Created on Sat Jul 18 17:06:32 2020

文件练习:将对话分条保存各个文件中
@author: dell
"""
#定义写入函数
def save_file(boy,girl,count): #传入两个列表(用于存储对话内容)和一个计数器
    file_name_boy='boy_'+str(count)+'.txt'#新建一系列文件,命名由字符串拼接
    file_name_girl='girl_'+str(count)+'.txt'#同理
   
    boy_file=open(file_name_boy,'w')#以写入方式打开
    girl_file=open(file_name_girl,'w') #同理
   
    boy_file.writelines(boy) #写入
    girl_file.writelines(girl)
   
    boy_file.close()   #关闭
    girl_file.close()
   
#定义切分函数   
def spilt_file(file_name): #传入文件名
      f = open(file_name,"r",encoding='UTF-8')
         #关键点,编码方式                   就这里换个编码形式
      boy=[]   
      girl=[]
      count=1   
            
      for each_line in f: #遍历原对话文件每一行
            if each_line[:6]!='======':
                (role,line_spoken)=each_line.split(':',1)
                #以:为界,分成元组,进行1次操作
                if role =='小甲鱼': #根据名称(前三个字符)不同分别记入两个列表
                  boy.append(line_spoken)
                if role =='小客服':
                  girl.append(line_spoken)
                  #到这一步,所有对话均被存入两列表
            else:
                save_file(boy,girl,count) #调用写入
               
                boy=[]
                girl=[]
                count+=1
            
      save_file(boy,girl,count)#第三段内容(上方for循环漏掉一次写入)
      f.close()   
      
   
   
spilt_file('record.txt')   

半夏冬青 发表于 2020-11-13 08:26:36

冬雪雪冬 发表于 2020-11-12 23:02
编码问题,把
f = open('record.txt')
改成


OK谢谢

半夏冬青 发表于 2020-11-13 11:01:45

那我这里又显示这样
(role,lines_spoken) = each_line.split(':',1)   # 用字符串的split分成两部分
ValueError: not enough values to unpack (expected 2, got 1)
怎么回事呢
页: [1]
查看完整版本: python 课程p30 的文件例子