longzhou520 发表于 2020-12-27 22:01:04

有大佬帮忙看看哪里出错了吗

f = open('D:\\record.txt')

boy = []
girl = []
count = 1

for each_line in f :
    if each_line[ :6] != '======' :
      (role, line_spoken) = each_line.split(':', 1)
      if role == '小甲鱼' :
            boy.append(line_spoken)
      if role == '小客服' :
            girl.append(line_spoken)
    else:
      file_name_boy = 'boy' + str(count) + '.txt'
      file_name_girl = 'girl' + str(count) + '.txt'

      boy_file = open(file_name_boy, 'w')
      girl_file = open(file_name_girl, 'w')

      boy_file.writelines(boy)
      girl_file.writelines(girl)

      boy_file.close()
      girl_file.close()

      boy = []
      girl = []
      count += 1

f.close()

昨非 发表于 2020-12-27 22:05:38

报错是什么

longzhou520 发表于 2020-12-27 22:06:54

昨非 发表于 2020-12-27 22:05
报错是什么

Traceback (most recent call last):
File "C:\Users\Administrator\PycharmProjects\pythonProject2\古诗.py", line 7, in <module>
    for each_line in f :
UnicodeDecodeError: 'gbk' codec can't decode byte 0xae in position 4: illegal multibyte sequence

昨非 发表于 2020-12-27 22:07:35

这里有全部的代码和注释,你参考下
#定义写入函数
def save_file(boy,girl,count): #传入两个列表(用于存储对话内容)和一个计数器
    file_name_boy='boy_'+str(count)+'.txt'#新建一系列文件,命名由字符串拼接
    file_name_girl='girl_'+str(count)+'.txt'#同理
   
    boy_file=open(file_name_boy,'w')#以写入方式打开
    girl_file=open(file_name_girl,'w') #同理
   
    boy_file.writelines(boy) #写入
    girl_file.writelines(girl)
   
    boy_file.close()   #关闭
    girl_file.close()
   
#定义切分函数   
def spilt_file(file_name): #传入文件名
      f = open(file_name,"r",encoding='UTF-8')
         #关键点,编码方式                   就这里换个编码形式
      boy=[]   
      girl=[]
      count=1   
            
      for each_line in f: #遍历原对话文件每一行
            if each_line[:6]!='======':#以分割线判断
                (role,line_spoken)=each_line.split(':',1)
                #以:为界,分成元组,进行1次操作
                if role =='小甲鱼': #根据名称(前三个字符)不同分别记入两个列表
                  boy.append(line_spoken)
                if role =='小客服':
                  girl.append(line_spoken)
                  #到这一步,所有对话均被存入两列表
            else:#不是分割线的情况下,写入
                save_file(boy,girl,count) #调用写入,写入后清空列表,等待下次添加对话内容
               
                boy=[]
                girl=[]
                count+=1   #count从2到3时跳出循环,所以文件里计数器count为3的那一对文件就缺少了
            
      save_file(boy,girl,count)#第三段内容(上方for循环漏掉一次写入)
      f.close()   
      
spilt_file('record.txt')   

昨非 发表于 2020-12-27 22:08:04

longzhou520 发表于 2020-12-27 22:06
Traceback (most recent call last):
File "C:%users\Administrator\PycharmProjects\pythonProject2\ ...

编码的问题,看第十七十八行

longzhou520 发表于 2020-12-27 22:08:52

昨非 发表于 2020-12-27 22:07
这里有全部的代码和注释,你参考下

谢谢大佬{:5_106:}

longzhou520 发表于 2020-12-27 22:34:54

昨非 发表于 2020-12-27 22:08
编码的问题,看第十七十八行

"C:\Program Files\Python39\python.exe" C:/Users/Administrator/PycharmProjects/pythonProject2/数组1.py
Traceback (most recent call last):
File "C:\Users\Administrator\PycharmProjects\pythonProject2\数组1.py", line 42, in <module>
    spilt_file('D:\\record.txt')
File "C:\Users\Administrator\PycharmProjects\pythonProject2\数组1.py", line 26, in spilt_file
    (role, line_spoken) = each_line.split(':', 1)
ValueError: not enough values to unpack (expected 2, got 1)

Process finished with exit code 1
还是有问题 跑不起来

昨非 发表于 2020-12-27 22:40:05

longzhou520 发表于 2020-12-27 22:34
"C:\Program Files\Python39\python.exe" C:/Users/Administrator/PycharmProjects/pythonProject2/数组1 ...

应该是你的txt文件格式问题,标点符号都会影响切分,你复制过去试试
小客服:小甲鱼,今天有客户问你有没有女朋友?
小甲鱼:咦??
小客服:我跟她说你有女朋友了!
小甲鱼:。。。。。
小客服:她让你分手后考虑下她!然后我说“。。”
小甲鱼:然后呢?
小客服:她。。。。
小甲鱼:呃。。。你真牛逼!
小客服:那是,。。。
小甲鱼:下次有人想调戏你,我不阻止
小客服:滚!!
===========================================================================
小客服:小甲鱼,有个好评很好笑
小甲鱼:哦?
小客服:“有了小甲鱼,妈妈再也。。。。”
小甲鱼:哈哈哈,看到了,我还发了微博呢~
小客服:我看了你的微博呀!
小甲鱼:哟西~
小客服:那个回复“。。。。。。”
小甲鱼:T_T
============================================================================
小客服:小甲鱼,今天一个会员想找你
小甲鱼:哦?什么事儿?
小客服:他说你的一个学生月薪已经超过12k了
小甲鱼:哪里的?
小客服:上海的
小甲鱼:那正常,哪家公司的?
小客服:没说啊
小甲鱼:哦
小客服:老大,为什么我工资那么低啊,是时候涨工资了!!
小甲鱼:啊?你说什么?外面风大,听不见啊~~~~
小客服:滚!!!

longzhou520 发表于 2020-12-27 22:59:07

昨非 发表于 2020-12-27 22:40
应该是你的txt文件格式问题,标点符号都会影响切分,你复制过去试试

{:5_108:}
页: [1]
查看完整版本: 有大佬帮忙看看哪里出错了吗