【Pyhon 029讲心得体会】【 分割小甲鱼和小客服对话】
本帖最后由 heidern0612 于 2018-12-17 10:05 编辑写的个人心得都是个人思考、猜测、臆断的过程,有错误难免,恳请广大鱼油给予指正。
这一讲比较难,其实很多方法都学过,但是不知道怎么用,看答案的时候恍然大悟,啊,原来这个还可以这么用。
所以学习有的时候是理论有了,动手比较少。有的时候理解艰难涩会的时候,就是敲代码敲的少了。
任何时候或者任何情况下的不理解、学的不好,都是因为代码敲的少。
但简洁也很重要,还是老师的那句话:Don't repeat yourself
以下部分文字摘自网络,只为个人学习使用,不用于任何商业用途。
1、老师视频里的疑问:
小甲鱼老师没有仔细的讲视频里最后(在封装函数之前),
为什么要复制添加创建文件的那步给全局变量里,难道只复制创建文件这一步就可以创建文件了吗?(只复制了for语句里else那一步)
分裂文件的依据呢? 上面虽然有分裂文件的依据,但是for循环好像都循环完了啊?
哎?好像似乎没循环完哈, 第三段对话开始的时候,似乎也进入了for循环的else语句,但是没有else判断了(因为else判断是==六个“=”号),
这里就是小甲鱼老师为什么只复制了下面一段else,没有复制上面if的缘故,因为if判断完了,文件也分裂完了,但是else不符合的情况下,自然就跳到下面的语句了。
其实还有个笨方法:不是靠"======"判断吗?那就在老师视频里txt文件的最尾部再多加一行"======",就不用那么多判断了 ,哈哈。
不废话,上代码分析:
#打开record.txt文件
f = open('E:\\record.txt')
#定义3个变量,并对它们初始化
boy = []
girl = []
count = 1
#循环读取文件
for each_line in f:
#如果当前内容不等于"======",则继续读取内容;否则读取,开始写操作
if each_line[:6] != "======":
#读取的内容以":"进行分割,分割后分别赋值给元组元素role和spoken
(role,spoken) = each_line.split(':',1)
#如果对话角色为"小甲鱼",则将文件追加到boy列表中
if role == '小甲鱼':
boy.append(spoken)
#如果对话角色为"小客服",则将文件追加到girl列表中
if role == '小客服':
girl.append(spoken)
else:
#定义输出文件名称
file_name_boy = 'boy_'+str(count)+'.txt'
file_name_girl = 'girl_'+str(count)+'.txt'
#打开文件
boy_file = open(file_name_boy,'w')
girl_file = open(file_name_girl,'w')
#writelines的参数是序列(比如列表),它会迭代帮你写入文件。
boy_file.writelines(boy)
girl_file.writelines(girl)
#关闭文件对象
boy_file.close()
girl_file.close()
#当前写操作完毕后,必须进行初始化操作,以准备下一个的写入操作
boy = []
girl = []
count += 1
#因为第三段对话的结尾没有"===",所以需要再次进行上面的重复写操作,保存第三段对话
#定义输出文件名称
file_name_boy = 'boy_'+str(count)+'.txt'
file_name_girl = 'girl'+str(count)+'.txt'
#打开文件
boy_file = open(file_name_boy,'w')
girl_file = open(file_name_girl,'w')
#writelines的参数是序列(比如列表),它会迭代帮你写入文件。
boy_file.writelines(boy)
girl_file.writelines(girl)
#关闭文件对象
boy_file.close()
girl_file.close()
#关闭文件对象
f.close()
定义函数之后的过程:
#定义一个保存文件的方法
def save_file(boy,girl,count):
#定义输出文件名称
file_name_boy = 'boy_' + str(count) + '.txt'
file_name_girl = 'girl_' + str(count) + '.txt'
#打开文件
boy_file = open('E:\\%s'%file_name_boy,'w')
girl_file = open('E:\\%s'%file_name_girl,'w')
#writelines的参数是序列(比如列表),它会迭代帮你写入文件
boy_file.writelines(boy)
girl_file.writelines(girl)
#关闭文件对象
boy_file.close()
girl_file.close()
#定义一个读取和分割文件内容的方法
def split_file(file_name):
f = open('E:\\record.txt')
#定义3个变量,并对它们初始化
boy = []
girl = []
count = 1
#循环读取文件
for each_line in f:
#如果当前内容不等于“======”,则读取内容分割;否则分类保存文件
if each_line[:6] != '======':
#读取的内容以“:”进行分割,分割后分别赋值给role和line_spoken
(role,line_spoken) = each_line.split(':',1)
#按对话角色分别把spoken追加到不同的表中
if role == '小甲鱼':
boy.append(line_spoken)
if role == '小客服':
girl.append(line_spoken)
else:
#保存文件
save_file(boy,girl,count)
#保存文件后,再初始化变量
count += 1
boy = []
girl = []
#因为第三段对话的结尾没有"===",所以需要再调用save_file方法,保存第三段对话
save_file(boy,girl,count)
f.close()
#主方法:只要调用split_file就可以完成所有的操作
split_file('E:\\record.txt')
这就是我说的,小积木成大擎天柱啊~封装之后清爽了许多。
分析动动手答案:
0.编写一个程序,接受用户的输入并保存为新的文件:
先输入文件名,然后打开文件,调用write将输入的字符串写入文件中,以:w作为写完标识符,写完之后调用close函数即完成文件的写入。
def filewrite(file_name):
print('请输入内容【单独输入‘:w’保存退出】:')
f=open(file_name,'w')
while True:
a=input()
if a!=':w':
f.write('%s'% a)
else:
break
f.close()
file_name=input('请输入文件名:')
filewrite(file_name)
1.编写一个程序比较用户输入的两个文件,如果不同,显示出所有不同处的行号与第一个不同字符的位置:
def compare(fname1,fname2): #这里定义的文件名,就是下面用户交互时输入的文件名,当然能在python目录下最好,不能的话,就得带上路径。
f1 = open(fname1) #只读模式默认打开
f2 = open(fname2)
count = 0 #统计行数
differ = [] #统计不一样的数量
for line1 in f1:
line2 = f2.readline()
count += 1 #随着行数的变化,count也跟着变化
if line1 != line2: #2者不相同的话,differ列表就append一个值,假定循环到第二行不相同,就添加一个2的数字元素进differ列表。
differ.append(count)
f1.close()
f2.close()
return differ #把differ列表返给函数。
fname1 = input('请输入需要比较的头一个文件名:')
fname2 = input('请输入需要比较的另一个文件名:')
differ = compare(fname1,fname2)
lenth = len(differ)
if len(differ) == 0: #如果上面compare函数中differ返回的是个空列表,判断两个文件相同。
#注:*这里的differ指的是函数compare内部的differ,不是外部被赋值给compare函数的全局变量differ。
#实际上,截止到上面那个函数定义完毕后,再出现的differ已经是个新的变量,不是原先的那个differ了。
print('两个文件完全一样!')
else:
print('两个文件共有%d处不同'%len(differ)) #这里几处不同len的是differ列表的长度。
for each in differ:
print('第%d行不一样'%each) #这里each代表是differ列表里每一个元素的值。
3.编写一个程序,当用户输入文件名和行数(N)后,将该文件的前N行内容打印到屏幕上:
def file_view(file_name,line_nun):
print('\n文件%s的前%s的内容如下:\n'%(file_name,line_num))
f = open(file_name) #打开用户input输入的文件名
for i in range(int(line_num)):
print(f.readline(),end='') #注意这里调用的readline,而不是readline的复数形式readlines,所以这里打开的都是单行。
#结合上面的for循环以及range范围,这里打开的依次就是range范围的文件单行。
f.close()
file_name = input(r'请输入要打开的文件(如C:\\test.txt):')
line_num = input('请输入需要显示该文件前几行:')
file_view(file_name,line_num)
谢谢分享 谢谢分享 请问下,第1题第22行代码,您注释写的是:这里的differ不是被compare赋值了的全局变量differ,也就是说这里的differ不是那个:differ = file_compare。但我搞不懂的是,def file_name里的differ,不是函数内部的局域变量吗?怎么可以在外面调用的呢? 来论坛学潮汕话 发表于 2019-2-2 21:25
请问下,第1题第22行代码,您注释写的是:这里的differ不是被compare赋值了的全局变量differ,也就是说这里 ...
名字是一样的,虽然内容也一样,但不是一个类型。
你可以看到定义的主函数返回的值是函数内部变量differ这个列表。
外面实例化函数后,实例化的名字也叫differ(其实就是重新赋值了下实例化,函数返回的结果还是内部那个列表) heidern0612 发表于 2019-2-2 21:53
名字是一样的,虽然内容也一样,但不是一个类型。
你可以看到定义的主函数返回的值是函数内部变量diff ...
明白了,也就是说不是调用局部变量differ,而是外部重新被赋值了的differ,只不过他们的结果是一样的,所以,如果compare函数中的differ返回的是个空列表,那么外部变量的differ也是个空列表 来论坛学潮汕话 发表于 2019-2-3 19:08
明白了,也就是说不是调用局部变量differ,而是外部重新被赋值了的differ,只不过他们的结果是一样的,所 ...
是的,是这个意思。 楼主,求解。基本每一个课后习题我都需要看答案才有思路,当时看完后可以写出来,并且也看得懂是什么意思,但是过了2天又忘记了。有什么比较好的方法么 xxwoaini897 发表于 2019-12-8 22:16
楼主,求解。基本每一个课后习题我都需要看答案才有思路,当时看完后可以写出来,并且也看得懂是什么意思, ...
多看多练。 新手有一个疑问:
#读取的内容以":"进行分割,分割后分别赋值给元组元素role和spoken
(role,spoken) = each_line.split(':',1)
在进行分割的时候,分割成两部分,为什么后一部分是到换行符为止的?(文件read()出来实际是有换行符的对吧?)这是一个默认吗? 落舞千秋 发表于 2019-12-10 00:17
新手有一个疑问:
#读取的内容以":"进行分割,分割后分别赋值给元组元素role和spoken
(role,spoken) ...
(role,spoken) = each_line.split(':',1)
role和spoken之间以冒号“:”为分割换行。 本帖最后由 落舞千秋 于 2019-12-10 14:14 编辑
谢谢,中午的时候打了一大堆发现又不对,全部删掉再来提问:
f= open('D:\\record.txt')
s = f.read()
for i in s:
if i[:6] != '======':
(a,b)=i.split(':',1)
print((a,b))
这样的话为何又会报错说值不足够分成2份?
#Traceback (most recent call last):
File "C:/Users/xxx/Desktop/2.py", line 6, in <module>
(a,b)=i.split(':',1)
ValueError: not enough values to unpack (expected 2, got 1)#
落舞千秋 发表于 2019-12-10 12:04
谢谢,中午的时候打了一大堆发现又不对,全部删掉再来提问:
检查中英文是否混用。
代码和txt文档都检查下。 heidern0612 发表于 2019-12-10 14:49
检查中英文是否混用。
代码和txt文档都检查下。
在别的帖子中找到了答案(是对象的问题),原来是文本文件是根据文本行来进行迭代的,所以可以这样分隔并换行,而我的s是字符串,是以单个字符进行迭代的,所以无法进行上面那样的分隔,也感谢大大的回复帮助 for line1 in f1:
line2 = f2.readline()
count += 1 #随着行数的变化,count也跟着变化
if line1 != line2: #2者不相同的话,differ列表就append一个值,假定循环到第二行不相同,就添加一个2的数字元素进differ列表。
differ.append(count)
请问for line1 in f1是对文件的f1遍历进行循环,这是按f1中的每个字符还是每行字符进行遍历? 一条咸鱼fish 发表于 2020-10-10 17:20
请问for line1 in f1是对文件的f1遍历进行循环,这是按f1中的每个字符还是每行字符进行遍历?
f1是打开的文件,for循环遍历的是每一行。
页:
[1]