马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
原地址:https://fishc.com.cn/thread-45890-1-2.html
这是任务要求分割的文本:小客服:小甲鱼,今天有客户问你有没有女朋友?
小甲鱼:咦??
小客服:我跟她说你有女朋友了!
小甲鱼:。。。。。。
小客服:她让你分手后考虑下她!然后我说:"您要买个优盘,我就帮您留意下~"
小甲鱼:然后呢?
小客服:她买了两个,说发一个货就好~
小甲鱼:呃。。。。。。你真牛!
小客服:那是,谁让我是鱼C最可爱小客服嘛~
小甲鱼:下次有人想调戏你我不阻止~
小客服:滚!!!
================================================================================
小客服:小甲鱼,有个好评很好笑哈。
小甲鱼:哦?
小客服:"有了小甲鱼,以后妈妈再也不用担心我的学习了~"
小甲鱼:哈哈哈,我看到丫,我还发微博了呢~
小客服:嗯嗯,我看了你的微博丫~
小甲鱼:哟西~
小客服:那个有条回复“左手拿著小甲魚,右手拿著打火機,哪裡不會點哪裡,so easy ^_^”
小甲鱼:T_T
================================================================================
小客服:小甲鱼,今天一个会员想找你
小甲鱼:哦?什么事?
小客服:他说你一个学生月薪已经超过12k了!!
小甲鱼:哪里的?
小客服:上海的
小甲鱼:那正常,哪家公司?
小客服:他没说呀。
小甲鱼:哦
小客服:老大,为什么我工资那么低啊??是时候涨涨工资了!!
小甲鱼:啊,你说什么?我在外边呢,这里好吵吖。。。。。。
小客服:滚!!!
目标是把这个文件 以‘=======’ 和‘男女’ 为区分 用 pickle 分割为 6个 文件。
我写的代码如下:def split(file_name):
import pickle
boy = []
girl = []
count = 0
file = open(file_name)
for each in file:
len6 = each[0:5] #切片是用‘:’
if len6 == '======':
count += 1
boy_file = open('boy_%d.txt' % count ,'wb')
girl_file = open('girl_%d.txt' % count ,'wb')
pickle.dump(boy,boy_file)
pickle.dump(girl,girl_file)
boy_file.close()
girl_file.close()
girl = []
boy = []
else:
sin = each.split(':',1)
sex = sin[0]
word = sin[1]
if sex =='小甲鱼':
boy.append(word)
elif sex =='小客服':
girl.append(word)
count += 1
boy_file = open('boy_%d.txt' % count ,'wb')
girl_file = open('girl_%d.txt' % count ,'wb')
pickle.dump(boy,boy_file)
pickle.dump(girl,girl_file)
boy_file.close()
girl_file.close()
girl = []
boy = []
name = input('输入文件名:')
split(name)
运行时 标红的代码 显示 index 的超过了,太怪了。
我对照了 小甲鱼 的答案 ,感觉除了蓝色部分没有单独用函数包装,其他都差不多呀?
以下是 答案 的代码:
import pickle
def save_file(boy, girl, count):
file_name_boy = 'boy_' + str(count) + '.txt'
file_name_girl = 'girl_' + str(count) + '.txt'
boy_file = open(file_name_boy, 'wb') # 记得一定要加 b 吖
girl_file = open(file_name_girl, 'wb') # 记得一定要加 b 吖
pickle.dump(boy, boy_file)
pickle.dump(girl, girl_file)
boy_file.close()
girl_file.close()
def split_file(file_name):
count = 1
boy = []
girl = []
f = open(file_name)
for each_line in f:
if each_line[:6] != '======':
(role, line_spoken) = each_line.split(':', 1)
if role == '小甲鱼':
boy.append(line_spoken)
if role == '小客服':
girl.append(line_spoken)
else:
save_file(boy, girl, count)
boy = []
girl = []
count += 1
save_file(boy, girl, count)
f.close()
split_file('record.txt')
怎么也想不明白,求助
索引超出范围的原因是因为你这里 len6 = each[0:5] 切的是五个字符,而 if 条件中有 6 个 = 号,导致 等号这行没进入 if 代码块,执行 else 进行 split 的切割
但是这一行全是等号的没有冒号进行 split 切割,所以 split 切割返回了一个 单元素列表,导致你索引 sin[1] 报错,所以只需要将切片中的 5 改成 6 即可
另外你忘记将 file close 了,虽然不影响代码运行结果,参考代码:
def split(file_name):
import pickle
boy = []
girl = []
count = 0
file = open(file_name, encoding='utf-8')
for each in file:
len6 = each[0:6] # 这里把 5 改成 6
if len6 == '======':
count += 1
boy_file = open('boy_%d.txt' % count ,'wb')
girl_file = open('girl_%d.txt' % count ,'wb')
pickle.dump(boy,boy_file)
pickle.dump(girl,girl_file)
boy_file.close()
girl_file.close()
girl = []
boy = []
else:
sin = each.split(':',1)
sex = sin[0]
word = sin[1]
if sex =='小甲鱼':
boy.append(word)
elif sex =='小客服':
girl.append(word)
count += 1
boy_file = open('boy_%d.txt' % count ,'wb')
girl_file = open('girl_%d.txt' % count ,'wb')
pickle.dump(boy,boy_file)
pickle.dump(girl,girl_file)
boy_file.close()
girl_file.close()
file.close()
name = input('输入文件名:')
split(name)
|