[已解决]当匹配到一行数据是打印这行数据相邻的几行数据

冬天的哈根达斯 · 发表于 2016-2-6 12:34:50

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

有文档1.txt如下：
@1234567890000
aaabbbcccdddeee
+
jjjjjjjjjjjjjjjjjjjjjjjjjjjjjjj
@23456789011111
bbbcccdddeeehhh
+
ssssssssssssssssssss
@33333333222222
cccaaadddeeebbb
+
gggggggggggggg
下面还有很多这样的数据.........

这个文件里（@1234567890000为第一行，jjjjjjjjjjjjjjjjjjjjjjjjjjjjjjj为第四行）为一个小组（后面还有很多这样的数据），当这个小组中的第二行满足条件有‘aaa’和‘bbb’时打印这个小组，同事写进文档2.txt。

最佳答案

月排行榜 / 总排行榜

漆雕古代

2016-2-7 17:20:24

我实验过了，可以的，处理catrl + c什么的细节方面我就没弄了

代码如下，注释也写好了，不懂可以追问

def obtenir_list(file_name): # 该函数用于获得原文件的内容
with open(file_name) as file:
return file.readlines()
def validerTrue(list_test, site): # 用于确定是否每一组第二行含有'aaa'和'bbb'
string = list_test[site]
if ('aaa' in string) and ('bbb' in string):
return 1
return 0
def writeintest(list_output, file_name): # 用于写入文件
with open(file_name,'w') as file:
file.writelines(list_output)
def outputLines(list_test, site): # 用于生成新的每一组需要保存的数据，返回一个字符串
list_site = [site - 1, site, site + 1, site + 2]
res = ''
for each_site in list_site:
res += list_test[each_site]
return res
def main(file_name):
list_test = obtenir_list(file_name) # 获得原文件的内容
# 每一组第二行相当于就是所有索引号是除以四以后余1的数
step = (i for i in range(len(list_test)) if i % 4 == 1 )
list_output = list() # 创建一个列表方便输出
for site in step:
if validerTrue(list_test, site):
# 将确认满足条件的数据写入输出的列表
list_output.append(outputLines(list_test, site))
file_name = input('请输入输出的文件名：')
writeintest(list_output, file_name)
return 1
if __name__ == '__main__':
main('text.txt')

复制代码

跳转到最佳答案楼层

65230215 · 发表于 2016-2-6 14:30:22

你的问题还没表述清楚。。而且还有错字。。

hldh214 · 发表于 2016-2-6 18:23:57

你是不会正则语法还是不知道怎么实时调试?

冬天的哈根达斯 · 发表于 2016-2-6 19:18:56

hldh214 发表于 2016-2-6 18:23
你是不会正则语法还是不知道怎么实时调试?

当匹配到第二行的时候不知道怎么把其它三行一起打印

hldh214 · 发表于 2016-2-6 19:34:50

冬天的哈根达斯发表于 2016-2-6 19:18
当匹配到第二行的时候不知道怎么把其它三行一起打印

你用findall方法了吗

冬天的哈根达斯 · 发表于 2016-2-6 20:38:36

hldh214 发表于 2016-2-6 19:34
你用findall方法了吗

是的

hldh214 · 发表于 2016-2-6 21:08:13

冬天的哈根达斯发表于 2016-2-6 20:38
是的

那就是你的表达式有问题啦, 不然肯定能匹配到所有符合要求的字符串的

冬天的哈根达斯 · 发表于 2016-2-6 23:20:28

hldh214 发表于 2016-2-6 21:08
那就是你的表达式有问题啦, 不然肯定能匹配到所有符合要求的字符串的

@1234567890000
aaabbbcccdddeee
+
jjjjjjjjjjjjjjjjjjjjjjjjjjjjjjj

比如说我匹配到第二行，但是我想把这四行都写进新的文件2.txt中怎么弄？

hldh214 · 发表于 2016-2-7 08:44:56

冬天的哈根达斯发表于 2016-2-6 23:20
@1234567890000
aaabbbcccdddeee
+

修改正则表达式

漆雕古代 · 发表于 2016-2-7 17:20:24

我实验过了，可以的，处理catrl + c什么的细节方面我就没弄了

代码如下，注释也写好了，不懂可以追问

def obtenir_list(file_name): # 该函数用于获得原文件的内容
with open(file_name) as file:
return file.readlines()
def validerTrue(list_test, site): # 用于确定是否每一组第二行含有'aaa'和'bbb'
string = list_test[site]
if ('aaa' in string) and ('bbb' in string):
return 1
return 0
def writeintest(list_output, file_name): # 用于写入文件
with open(file_name,'w') as file:
file.writelines(list_output)
def outputLines(list_test, site): # 用于生成新的每一组需要保存的数据，返回一个字符串
list_site = [site - 1, site, site + 1, site + 2]
res = ''
for each_site in list_site:
res += list_test[each_site]
return res
def main(file_name):
list_test = obtenir_list(file_name) # 获得原文件的内容
# 每一组第二行相当于就是所有索引号是除以四以后余1的数
step = (i for i in range(len(list_test)) if i % 4 == 1 )
list_output = list() # 创建一个列表方便输出
for site in step:
if validerTrue(list_test, site):
# 将确认满足条件的数据写入输出的列表
list_output.append(outputLines(list_test, site))
file_name = input('请输入输出的文件名：')
writeintest(list_output, file_name)
return 1
if __name__ == '__main__':
main('text.txt')

复制代码

冬天的哈根达斯 · 发表于 2016-2-9 23:17:13

漆雕古代发表于 2016-2-7 17:20
我实验过了，可以的，处理catrl + c什么的细节方面我就没弄了

代码如下，注释也写好了，不懂可以追问

感谢！我试一试

冬天的哈根达斯 · 发表于 2016-2-9 23:23:49

hldh214 发表于 2016-2-7 08:44
修改正则表达式

a1.txt内容如下：
qwertyuiop
aaasdfgbbb
asdfghjkl
zxcvbnm

import re
x = open('F:/a1.txt','r')
x1 = open('F:/aa1.txt','w')
y = x.readlines()
r = r'aaa.+bbb'
c = [i for i in y if re.findall(r,i)]

x1.writelines(c)
x1.close()
求指点，帮忙修改一下，怎么样可以在匹配上的时候第二行，同时打印四行。

hldh214 · 发表于 2016-2-10 10:09:39

冬天的哈根达斯发表于 2016-2-9 23:23
a1.txt内容如下：
qwertyuiop
aaasdfgbbb

\w+\saaa.+bbb\s\w+\s\w+

复制代码

冬天的哈根达斯 · 发表于 2016-2-10 11:05:15

hldh214 发表于 2016-2-10 10:09

\w后面的+号是代表重复一次或多次，还是代表行与行之间的相加。

hldh214 · 发表于 2016-2-10 17:57:09

冬天的哈根达斯发表于 2016-2-10 11:05
\w后面的+号是代表重复一次或多次，还是代表行与行之间的相加。

是代表一次或多次, 可以匹配成功吗

冬天的哈根达斯 · 发表于 2016-2-11 23:56:57

hldh214 发表于 2016-2-10 17:57
是代表一次或多次, 可以匹配成功吗

要用*号不能用+号

账号		自动登录	找回密码
密码			立即注册

[已解决]当匹配到一行数据是打印这行数据相邻的几行数据

马上注册，结交更多好友，享用更多功能^_^

评分

浏览过的版块