很新手的一个问题,麻烦各位大佬帮忙解决一下,谢谢
f = open('D:\\pycharm\\record.txt.txt')boy = []
girl = []
count = 1
for eachline in f:
if eachline[:4] != '====':
(role , spoken) = eachline.split(':',1)
if role == '小甲鱼':
boy.append(spoken)
if role == '小客服':
girl.append(spoken)
else:
filenameboy = 'boy' + str(count) +'.txt'
filenamegirl = 'girl' + str(count) + '.txt'
boyfile = open(filenameboy , 'w')
girlfile = open(filenamegirl , 'w')
boyfile.writelines(boy)
girlfile.writelines(girl)
count += 1
boy = []
girl = []
boyfile.close()
girlfile.close()
f.close()
为什么会报错呢?
错误是:
D:\pycharm\venv\Scripts\python.exe D:/pycharm/main.py
Traceback (most recent call last):
File "D:/pycharm/main.py", line 7, in <module>
for eachline in f:
UnicodeDecodeError: 'gbk' codec can't decode byte 0xae in position 19: illegal multibyte sequence
Process finished with exit code 1 #定义写入函数
def save_file(boy,girl,count): #传入两个列表(用于存储对话内容)和一个计数器
file_name_boy='boy_'+str(count)+'.txt'#新建一系列文件,命名由字符串拼接
file_name_girl='girl_'+str(count)+'.txt'#同理
boy_file=open(file_name_boy,'w')#以写入方式打开
girl_file=open(file_name_girl,'w') #同理
boy_file.writelines(boy) #写入
girl_file.writelines(girl)
boy_file.close() #关闭
girl_file.close()
#定义切分函数
def spilt_file(file_name): #传入文件名
f = open(file_name,"r",encoding='UTF-8')
#关键点,编码方式 就这里换个编码形式
boy=[]
girl=[]
count=1
for each_line in f: #遍历原对话文件每一行
if each_line[:6]!='======':
(role,line_spoken)=each_line.split(':',1)
#以:为界,分成元组,进行1次操作
if role =='小甲鱼': #根据名称(前三个字符)不同分别记入两个列表
boy.append(line_spoken)
if role =='小客服':
girl.append(line_spoken)
#到这一步,所有对话均被存入两列表
else:
save_file(boy,girl,count) #调用写入
boy=[]
girl=[]
count+=1
save_file(boy,girl,count)#第三段内容(上方for循环漏掉一次写入)
f.close()
spilt_file('record.txt') 第十八行,编码方式 报错是解码错误。一个汉字占2个字节,例如第一个字符是汉字,那么指针0可以正确解码,指针1的时候正好位于汉字字符的中间,所以不能正常解码 昨非 发表于 2020-10-19 23:01
第十八行,编码方式
我换了还是报错
D:\pycharm\venv\Scripts\python.exe D:/pycharm/main.py
Traceback (most recent call last):
File "D:/pycharm/main.py", line 9, in <module>
(role,spoken) = eachline.split(':',1)
ValueError: not enough values to unpack (expected 2, got 1)
f = open('D:\\pycharm\\record.txt.txt',encoding='UTF-8')
boy = []
girl = []
count = 1
for eachline in f:
if eachline[:4] != '====':
(role,spoken) = eachline.split(':',1)
if role == '小甲鱼':
boy.append(spoken)
if role == '小客服':
girl.append(spoken)
else:
filenameboy = 'boy' + str(count) +'.txt'
filenamegirl = 'girl' + str(count) + '.txt'
boyfile = open(filenameboy , 'w')
girlfile = open(filenamegirl , 'w')
boyfile.writelines(boy)
girlfile.writelines(girl)
count += 1
boy = []
girl = []
boyfile.close()
girlfile.close()
f.close() DoubleS、Zhao 发表于 2020-10-20 15:17
我换了还是报错
D:\pycharm\venv\Scripts\python.exe D:/pycharm/main.py
你的TXT文件可能没有按小甲鱼要求写,编码那块确实是没问题了 昨非 发表于 2020-10-20 15:19
你的TXT文件可能没有按小甲鱼要求写,编码那块确实是没问题了
确实没有,找不着小甲鱼的txt源文件,大佬有吗?谢谢你啦!!! DoubleS、Zhao 发表于 2020-10-20 19:12
确实没有,找不着小甲鱼的txt源文件,大佬有吗?谢谢你啦!!!
小客服:小甲鱼,今天有客户问你有没有女朋友?
小甲鱼:咦??
小客服:我跟她说你有女朋友了!
小甲鱼:。。。。。
小客服:她让你分手后考虑下她!然后我说“。。”
小甲鱼:然后呢?
小客服:她。。。。
小甲鱼:呃。。。你真牛逼!
小客服:那是,。。。
小甲鱼:下次有人想调戏你,我不阻止
小客服:滚!!
===========================================================================
小客服:小甲鱼,有个好评很好笑
小甲鱼:哦?
小客服:“有了小甲鱼,妈妈再也。。。。”
小甲鱼:哈哈哈,看到了,我还发了微博呢~
小客服:我看了你的微博呀!
小甲鱼:哟西~
小客服:那个回复“。。。。。。”
小甲鱼:T_T
============================================================================
小客服:小甲鱼,今天一个会员想找你
小甲鱼:哦?什么事儿?
小客服:他说你的一个学生月薪已经超过12k了
小甲鱼:哪里的?
小客服:上海的
小甲鱼:那正常,哪家公司的?
小客服:没说啊
小甲鱼:哦
小客服:老大,为什么我工资那么低啊,是时候涨工资了!!
小甲鱼:啊?你说什么?外面风大,听不见啊~~~~
小客服:滚!!! DoubleS、Zhao 发表于 2020-10-20 19:12
确实没有,找不着小甲鱼的txt源文件,大佬有吗?谢谢你啦!!!
我的命名是record.txt
你复制过去再跑我刚刚的代码就不会有问题了 满意的话记得设置【最佳答案】,这对我们很重要{:10_266:}
页:
[1]