【Pyhon 029讲心得体会】【分割小甲鱼和小客服对话】,萌新交流区,萌新训练营,鱼C论坛

heidern0612 发表于 2018-11-24 19:30:22

【Pyhon 029讲心得体会】【分割小甲鱼和小客服对话】

本帖最后由 heidern0612 于 2018-12-17 10:05 编辑

写的个人心得都是个人思考、猜测、臆断的过程，有错误难免，恳请广大鱼油给予指正。

这一讲比较难，其实很多方法都学过，但是不知道怎么用，看答案的时候恍然大悟，啊，原来这个还可以这么用。

所以学习有的时候是理论有了，动手比较少。有的时候理解艰难涩会的时候，就是敲代码敲的少了。

任何时候或者任何情况下的不理解、学的不好，都是因为代码敲的少。

但简洁也很重要，还是老师的那句话:Don't repeat yourself

以下部分文字摘自网络，只为个人学习使用，不用于任何商业用途。

1、老师视频里的疑问:

小甲鱼老师没有仔细的讲视频里最后（在封装函数之前），

为什么要复制添加创建文件的那步给全局变量里，难道只复制创建文件这一步就可以创建文件了吗？（只复制了for语句里else那一步）

分裂文件的依据呢？上面虽然有分裂文件的依据，但是for循环好像都循环完了啊？

哎？好像似乎没循环完哈，第三段对话开始的时候，似乎也进入了for循环的else语句，但是没有else判断了（因为else判断是==六个“=”号），

这里就是小甲鱼老师为什么只复制了下面一段else，没有复制上面if的缘故，因为if判断完了，文件也分裂完了，但是else不符合的情况下，自然就跳到下面的语句了。

其实还有个笨方法:不是靠"======"判断吗？那就在老师视频里txt文件的最尾部再多加一行"======"，就不用那么多判断了，哈哈。

不废话，上代码分析：

#打开record.txt文件
f = open('E:\\record.txt')

#定义3个变量，并对它们初始化
boy = []
girl = []
count = 1

#循环读取文件
for each_line in f:

#如果当前内容不等于"======"，则继续读取内容；否则读取，开始写操作
if each_line[:6] != "======":

#读取的内容以":"进行分割，分割后分别赋值给元组元素role和spoken
(role,spoken) = each_line.split('：',1)

#如果对话角色为"小甲鱼"，则将文件追加到boy列表中
if role == '小甲鱼':
   boy.append(spoken)

#如果对话角色为"小客服"，则将文件追加到girl列表中
if role == '小客服':
   girl.append(spoken)
else:
#定义输出文件名称
file_name_boy = 'boy_'+str(count)+'.txt'
file_name_girl = 'girl_'+str(count)+'.txt'

#打开文件
boy_file = open(file_name_boy,'w')
girl_file = open(file_name_girl,'w')

#writelines的参数是序列(比如列表)，它会迭代帮你写入文件。
boy_file.writelines(boy)
girl_file.writelines(girl)

#关闭文件对象
boy_file.close()
girl_file.close()

#当前写操作完毕后，必须进行初始化操作，以准备下一个的写入操作
boy = []
girl = []
count += 1

#因为第三段对话的结尾没有"==="，所以需要再次进行上面的重复写操作，保存第三段对话
#定义输出文件名称
file_name_boy = 'boy_'+str(count)+'.txt'
file_name_girl = 'girl'+str(count)+'.txt'

#打开文件
boy_file = open(file_name_boy,'w')
girl_file = open(file_name_girl,'w')

#writelines的参数是序列(比如列表)，它会迭代帮你写入文件。
boy_file.writelines(boy)
girl_file.writelines(girl)

#关闭文件对象
boy_file.close()
girl_file.close()

#关闭文件对象
f.close()

定义函数之后的过程:

#定义一个保存文件的方法
def save_file(boy,girl,count):
#定义输出文件名称
file_name_boy = 'boy_' + str(count) + '.txt'
file_name_girl = 'girl_' + str(count) + '.txt'
#打开文件
boy_file = open('E:\\%s'%file_name_boy,'w')
girl_file = open('E:\\%s'%file_name_girl,'w')
#writelines的参数是序列（比如列表），它会迭代帮你写入文件
boy_file.writelines(boy)
girl_file.writelines(girl)
#关闭文件对象
boy_file.close()
girl_file.close()
#定义一个读取和分割文件内容的方法
def split_file(file_name):
f = open('E:\\record.txt')
#定义3个变量，并对它们初始化
boy = []
girl = []
count = 1
#循环读取文件
for each_line in f:
   #如果当前内容不等于“======”，则读取内容分割；否则分类保存文件
   if each_line[:6] != '======':
         #读取的内容以“：”进行分割，分割后分别赋值给role和line_spoken
         (role,line_spoken) = each_line.split('：',1)
         #按对话角色分别把spoken追加到不同的表中
         if role == '小甲鱼':
            boy.append(line_spoken)
         if role == '小客服':
            girl.append(line_spoken)
   else:
         #保存文件
         save_file(boy,girl,count)
         #保存文件后，再初始化变量
         count += 1
         boy = []
         girl = []
#因为第三段对话的结尾没有"==="，所以需要再调用save_file方法，保存第三段对话
save_file(boy,girl,count)
f.close()
#主方法：只要调用split_file就可以完成所有的操作
split_file('E:\\record.txt')

这就是我说的，小积木成大擎天柱啊~封装之后清爽了许多。

分析动动手答案：

0.编写一个程序，接受用户的输入并保存为新的文件：

先输入文件名，然后打开文件，调用write将输入的字符串写入文件中，以：w作为写完标识符，写完之后调用close函数即完成文件的写入。

def filewrite(file_name):
print('请输入内容【单独输入‘：w’保存退出】：')
f=open(file_name,'w')
while True:
      a=input()
      if a!=':w':
         f.write('%s'% a)
      else:
            break

f.close()

file_name=input('请输入文件名：')
filewrite(file_name)

1.编写一个程序比较用户输入的两个文件，如果不同，显示出所有不同处的行号与第一个不同字符的位置：
def compare(fname1,fname2): #这里定义的文件名，就是下面用户交互时输入的文件名，当然能在python目录下最好，不能的话，就得带上路径。
f1 = open(fname1) #只读模式默认打开
f2 = open(fname2)
count = 0 #统计行数
differ = [] #统计不一样的数量
for line1 in f1:
   line2 = f2.readline()
   count += 1 #随着行数的变化，count也跟着变化
   if line1 != line2: #2者不相同的话，differ列表就append一个值，假定循环到第二行不相同，就添加一个2的数字元素进differ列表。
         differ.append(count)

f1.close()
f2.close()
return differ #把differ列表返给函数。

fname1 = input('请输入需要比较的头一个文件名：')
fname2 = input('请输入需要比较的另一个文件名：')

differ = compare(fname1,fname2)

lenth = len(differ)
if len(differ) == 0: #如果上面compare函数中differ返回的是个空列表，判断两个文件相同。
#注：*这里的differ指的是函数compare内部的differ，不是外部被赋值给compare函数的全局变量differ。
#实际上，截止到上面那个函数定义完毕后，再出现的differ已经是个新的变量，不是原先的那个differ了。

print('两个文件完全一样！')
else:
print('两个文件共有%d处不同'%len(differ)) #这里几处不同len的是differ列表的长度。
for each in differ:
   print('第%d行不一样'%each) #这里each代表是differ列表里每一个元素的值。

3.编写一个程序，当用户输入文件名和行数（N）后，将该文件的前N行内容打印到屏幕上：
def file_view(file_name,line_nun):
print('\n文件%s的前%s的内容如下：\n'%(file_name,line_num))
f = open(file_name) #打开用户input输入的文件名
for i in range(int(line_num)):
   print(f.readline(),end='') #注意这里调用的readline，而不是readline的复数形式readlines，所以这里打开的都是单行。
#结合上面的for循环以及range范围，这里打开的依次就是range范围的文件单行。

f.close()

file_name = input(r'请输入要打开的文件（如C:\\test.txt）：')
line_num = input('请输入需要显示该文件前几行：')
file_view(file_name,line_num)

lwtzoez 发表于 2018-12-4 19:35:35

谢谢分享

鱼C_Newbie 发表于 2018-12-4 20:12:31

谢谢分享

来论坛学潮汕话 发表于 2019-2-2 21:25:17

请问下，第1题第22行代码，您注释写的是：这里的differ不是被compare赋值了的全局变量differ，也就是说这里的differ不是那个：differ = file_compare。但我搞不懂的是，def file_name里的differ，不是函数内部的局域变量吗？怎么可以在外面调用的呢？

heidern0612 发表于 2019-2-2 21:53:28

来论坛学潮汕话发表于 2019-2-2 21:25
请问下，第1题第22行代码，您注释写的是：这里的differ不是被compare赋值了的全局变量differ，也就是说这里 ...

名字是一样的，虽然内容也一样，但不是一个类型。

你可以看到定义的主函数返回的值是函数内部变量differ这个列表。

外面实例化函数后，实例化的名字也叫differ（其实就是重新赋值了下实例化，函数返回的结果还是内部那个列表）

来论坛学潮汕话 发表于 2019-2-3 19:08:44

heidern0612 发表于 2019-2-2 21:53
名字是一样的，虽然内容也一样，但不是一个类型。

你可以看到定义的主函数返回的值是函数内部变量diff ...

明白了，也就是说不是调用局部变量differ，而是外部重新被赋值了的differ，只不过他们的结果是一样的，所以，如果compare函数中的differ返回的是个空列表，那么外部变量的differ也是个空列表

heidern0612 发表于 2019-2-3 19:40:00

来论坛学潮汕话发表于 2019-2-3 19:08
明白了，也就是说不是调用局部变量differ，而是外部重新被赋值了的differ，只不过他们的结果是一样的，所 ...

是的，是这个意思。

xxwoaini897 发表于 2019-12-8 22:16:54

楼主，求解。基本每一个课后习题我都需要看答案才有思路，当时看完后可以写出来，并且也看得懂是什么意思，但是过了2天又忘记了。有什么比较好的方法么

heidern0612 发表于 2019-12-9 17:41:37

xxwoaini897 发表于 2019-12-8 22:16
楼主，求解。基本每一个课后习题我都需要看答案才有思路，当时看完后可以写出来，并且也看得懂是什么意思， ...

多看多练。

落舞千秋 发表于 2019-12-10 00:17:01

新手有一个疑问：
#读取的内容以":"进行分割，分割后分别赋值给元组元素role和spoken
(role,spoken) = each_line.split('：',1)
在进行分割的时候，分割成两部分，为什么后一部分是到换行符为止的？（文件read（）出来实际是有换行符的对吧？）这是一个默认吗？

heidern0612 发表于 2019-12-10 09:53:08

落舞千秋发表于 2019-12-10 00:17
新手有一个疑问：
#读取的内容以":"进行分割，分割后分别赋值给元组元素role和spoken
(role,spoken) ...

(role,spoken) = each_line.split('：',1)

role和spoken之间以冒号“：”为分割换行。

落舞千秋 发表于 2019-12-10 12:04:02

本帖最后由落舞千秋于 2019-12-10 14:14 编辑

谢谢，中午的时候打了一大堆发现又不对，全部删掉再来提问：
f= open('D:\\record.txt')
s = f.read()

for i in s:
if i[:6] != '======':
(a,b)=i.split(':',1)
print((a,b))

这样的话为何又会报错说值不足够分成2份？
#Traceback (most recent call last):
File "C:/Users/xxx/Desktop/2.py", line 6, in <module>
(a,b)=i.split(':',1)
ValueError: not enough values to unpack (expected 2, got 1)#

heidern0612 发表于 2019-12-10 14:49:30

落舞千秋发表于 2019-12-10 12:04
谢谢，中午的时候打了一大堆发现又不对，全部删掉再来提问：

检查中英文是否混用。

代码和txt文档都检查下。

落舞千秋 发表于 2019-12-10 21:46:10

heidern0612 发表于 2019-12-10 14:49
检查中英文是否混用。

代码和txt文档都检查下。

在别的帖子中找到了答案（是对象的问题），原来是文本文件是根据文本行来进行迭代的，所以可以这样分隔并换行，而我的s是字符串，是以单个字符进行迭代的，所以无法进行上面那样的分隔，也感谢大大的回复帮助

一条咸鱼fish 发表于 2020-10-10 17:20:01

for line1 in f1:
   line2 = f2.readline()
   count += 1                                     #随着行数的变化，count也跟着变化
   if line1 != line2:                                     #2者不相同的话，differ列表就append一个值，假定循环到第二行不相同，就添加一个2的数字元素进differ列表。
         differ.append(count)

请问for line1 in f1是对文件的f1遍历进行循环，这是按f1中的每个字符还是每行字符进行遍历？

heidern0612 发表于 2020-10-12 14:25:33

一条咸鱼fish 发表于 2020-10-10 17:20
请问for line1 in f1是对文件的f1遍历进行循环，这是按f1中的每个字符还是每行字符进行遍历？

f1是打开的文件，for循环遍历的是每一行。

页: [1]

鱼C论坛's Archiver

【Pyhon 029讲心得体会】【 分割小甲鱼和小客服对话】

【Pyhon 029讲心得体会】【分割小甲鱼和小客服对话】