DoubleS、Zhao 发表于 2020-10-19 22:59:31

很新手的一个问题,麻烦各位大佬帮忙解决一下,谢谢

f = open('D:\\pycharm\\record.txt.txt')

boy = []
girl = []
count = 1

for eachline in f:
    if eachline[:4] != '====':
      (role , spoken) = eachline.split(':',1)
      if role == '小甲鱼':
            boy.append(spoken)
      if role == '小客服':
            girl.append(spoken)
    else:
      filenameboy = 'boy' + str(count) +'.txt'
      filenamegirl = 'girl' + str(count) + '.txt'

      boyfile = open(filenameboy , 'w')
      girlfile = open(filenamegirl , 'w')

      boyfile.writelines(boy)
      girlfile.writelines(girl)

      count += 1
      boy = []
      girl = []

      boyfile.close()
      girlfile.close()

f.close()


为什么会报错呢?


错误是:
D:\pycharm\venv\Scripts\python.exe D:/pycharm/main.py
Traceback (most recent call last):
File "D:/pycharm/main.py", line 7, in <module>
    for eachline in f:
UnicodeDecodeError: 'gbk' codec can't decode byte 0xae in position 19: illegal multibyte sequence

Process finished with exit code 1

昨非 发表于 2020-10-19 23:00:51

#定义写入函数
def save_file(boy,girl,count): #传入两个列表(用于存储对话内容)和一个计数器
    file_name_boy='boy_'+str(count)+'.txt'#新建一系列文件,命名由字符串拼接
    file_name_girl='girl_'+str(count)+'.txt'#同理
   
    boy_file=open(file_name_boy,'w')#以写入方式打开
    girl_file=open(file_name_girl,'w') #同理
   
    boy_file.writelines(boy) #写入
    girl_file.writelines(girl)
   
    boy_file.close()   #关闭
    girl_file.close()
   
#定义切分函数   
def spilt_file(file_name): #传入文件名
      f = open(file_name,"r",encoding='UTF-8')
         #关键点,编码方式                   就这里换个编码形式
      boy=[]   
      girl=[]
      count=1   
            
      for each_line in f: #遍历原对话文件每一行
            if each_line[:6]!='======':
                (role,line_spoken)=each_line.split(':',1)
                #以:为界,分成元组,进行1次操作
                if role =='小甲鱼': #根据名称(前三个字符)不同分别记入两个列表
                  boy.append(line_spoken)
                if role =='小客服':
                  girl.append(line_spoken)
                  #到这一步,所有对话均被存入两列表
            else:
                save_file(boy,girl,count) #调用写入
               
                boy=[]
                girl=[]
                count+=1
            
      save_file(boy,girl,count)#第三段内容(上方for循环漏掉一次写入)
      f.close()   
      
   
   
spilt_file('record.txt')   

昨非 发表于 2020-10-19 23:01:24

第十八行,编码方式

笨鸟学飞 发表于 2020-10-19 23:19:58

报错是解码错误。一个汉字占2个字节,例如第一个字符是汉字,那么指针0可以正确解码,指针1的时候正好位于汉字字符的中间,所以不能正常解码

DoubleS、Zhao 发表于 2020-10-20 15:17:28

昨非 发表于 2020-10-19 23:01
第十八行,编码方式

我换了还是报错

D:\pycharm\venv\Scripts\python.exe D:/pycharm/main.py
Traceback (most recent call last):
File "D:/pycharm/main.py", line 9, in <module>
    (role,spoken) = eachline.split(':',1)
ValueError: not enough values to unpack (expected 2, got 1)


f = open('D:\\pycharm\\record.txt.txt',encoding='UTF-8')

boy = []
girl = []
count = 1

for eachline in f:
    if eachline[:4] != '====':
      (role,spoken) = eachline.split(':',1)
      if role == '小甲鱼':
            boy.append(spoken)
      if role == '小客服':
            girl.append(spoken)
    else:
      filenameboy = 'boy' + str(count) +'.txt'
      filenamegirl = 'girl' + str(count) + '.txt'

      boyfile = open(filenameboy , 'w')
      girlfile = open(filenamegirl , 'w')

      boyfile.writelines(boy)
      girlfile.writelines(girl)

      count += 1
      boy = []
      girl = []

      boyfile.close()
      girlfile.close()

f.close()

昨非 发表于 2020-10-20 15:19:57

DoubleS、Zhao 发表于 2020-10-20 15:17
我换了还是报错

D:\pycharm\venv\Scripts\python.exe D:/pycharm/main.py


你的TXT文件可能没有按小甲鱼要求写,编码那块确实是没问题了

DoubleS、Zhao 发表于 2020-10-20 19:12:01

昨非 发表于 2020-10-20 15:19
你的TXT文件可能没有按小甲鱼要求写,编码那块确实是没问题了

确实没有,找不着小甲鱼的txt源文件,大佬有吗?谢谢你啦!!!

昨非 发表于 2020-10-20 19:13:58

DoubleS、Zhao 发表于 2020-10-20 19:12
确实没有,找不着小甲鱼的txt源文件,大佬有吗?谢谢你啦!!!

小客服:小甲鱼,今天有客户问你有没有女朋友?
小甲鱼:咦??
小客服:我跟她说你有女朋友了!
小甲鱼:。。。。。
小客服:她让你分手后考虑下她!然后我说“。。”
小甲鱼:然后呢?
小客服:她。。。。
小甲鱼:呃。。。你真牛逼!
小客服:那是,。。。
小甲鱼:下次有人想调戏你,我不阻止
小客服:滚!!
===========================================================================
小客服:小甲鱼,有个好评很好笑
小甲鱼:哦?
小客服:“有了小甲鱼,妈妈再也。。。。”
小甲鱼:哈哈哈,看到了,我还发了微博呢~
小客服:我看了你的微博呀!
小甲鱼:哟西~
小客服:那个回复“。。。。。。”
小甲鱼:T_T
============================================================================
小客服:小甲鱼,今天一个会员想找你
小甲鱼:哦?什么事儿?
小客服:他说你的一个学生月薪已经超过12k了
小甲鱼:哪里的?
小客服:上海的
小甲鱼:那正常,哪家公司的?
小客服:没说啊
小甲鱼:哦
小客服:老大,为什么我工资那么低啊,是时候涨工资了!!
小甲鱼:啊?你说什么?外面风大,听不见啊~~~~
小客服:滚!!!

昨非 发表于 2020-10-20 19:15:00

DoubleS、Zhao 发表于 2020-10-20 19:12
确实没有,找不着小甲鱼的txt源文件,大佬有吗?谢谢你啦!!!

我的命名是record.txt
你复制过去再跑我刚刚的代码就不会有问题了

昨非 发表于 2020-10-20 19:18:40

满意的话记得设置【最佳答案】,这对我们很重要{:10_266:}
页: [1]
查看完整版本: 很新手的一个问题,麻烦各位大佬帮忙解决一下,谢谢