Thanere 发表于 2022-4-11 13:16:37

两文件匹配

本帖最后由 Thanere 于 2022-4-11 13:19 编辑

文件A第一列是名称。第二列是X的值,文件B第一列也是名称,第二,三列是取值范围的最小值和最大值
匹配条件:名称相同且X在取值范围内

我想把文件A中符合匹配条件的行提取出来

f1 = open('A.txt','r')
f2 = open('B.txt','r')
list1= []
list2= []
n = 0
for i in f1:
    chr = i.split('\t')
    pos = i.split('\t')
    list1.append(chr)
    list2.append(pos)

for line in f2:
    name = line.split('\t')
    star = int(line.split('\t'))
    end = int(line.split('\t'))
    a = list1
    b = int(list2)
    if a == name and b in range(star, end):

      n += 1
      
      f2.seek(0)
以上是写好的,基本思路是将文件A读取成列表,遍历文件B并比较名称和取值范围,成功匹配后列表读取位置+1并返回文件B的第一行重头匹配避免遗漏

现在的问题是不知道如何跳过列表中名称一样但X不在取值范围内的值,求大佬解答

傻眼貓咪 发表于 2022-4-11 15:04:45

试试这个:A = dict() # 空字典
with open('A.txt','r') as file:
        for line in file:
                name, pos = line.split('\t')
                A = int(pos) # 将所有 A 数据存入字典里

res = [] # 空列表
with open('B.txt','r') as file:
        for line in file:
                name, start, end = line.split('\t')
                if name in A: # 如果出现在字典中
                        if A in range(int(star), int(end)): # 且在指定范围内
                                res.append(name) # 其名字存入数组里

print(*res) # 打印
页: [1]
查看完整版本: 两文件匹配