鱼C论坛

 找回密码
 立即注册
查看: 1157|回复: 7

[已解决]序列提取

[复制链接]
发表于 2019-12-26 21:47:56 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
有A和B两个文件,如下所示
A文件

A        3-6
A        8-12
C        2-5
D        1-22
......(等)


B文件
>A
CDFEGHFSDFMKDSVFDJFSDNCVNJJSDFHSDFDSNVCVSDLDJFISADKLFDDN
>B
dfweiuffhdvdofioejerjngvfhuvdlssfdsjvfmncvvm
>C
SDFOIJSNFVDVMLGIFU8RJVOFVKSDOPIJVCSDUIVNVJUISDPJVHNDSISDJDSIOUVJHCSDLI
>D
EWREDUSFHUDSIHFDSLFLDSNVJSVBHIYFCHUSDBKHSDKVSDYVSDNVBKHSDFVSDUVHDSVSDVJNBDSLHV
......(等)

根据A的位置提取B的序列,结果如C
>A        3-6
FEGH
>A        8-12
SDFMK
>C        2-5
DFOI
>D        1-22
EWREDUSFHUDSIHFDSLFLDS
......(等)
最佳答案
2019-12-26 22:26:24
本帖最后由 阴阳神万物主 于 2019-12-26 23:11 编辑

值这么些鱼币?
代码:
  1. def finding(a:'文件路径'=r'./A.txt',b:'文件路径'=r'./B.txt',c:'文件路径'=r'./C.txt'):
  2.     f1 = open(a)
  3.     f2 = open(b)
  4.     f3 = open(c,'w')
  5.     for line in f1:
  6.         code,num = line.split()
  7.         na,nb = num.split('-')
  8.         na = int(na)-1
  9.         nb = int(nb)
  10.         f2.seek(0)
  11.         while True:
  12.             linb = f2.readline()
  13.             if linb[0] == '>':
  14.                 if code == linb[1:-1]:
  15.                     break
  16.         linb = f2.readline()
  17.         linb = linb[:-1] if linb[-1] == '\n' else linb
  18.         f3.write('>'+(line if line[-1]=='\n' else (line+'\n')))
  19.         f3.write(linb[na:nb]+'\n')
  20.     f1.close()
  21.     f2.close()
  22.     f3.close()
  23.     print('over')
复制代码
反正我这里运行没毛病

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2019-12-26 22:20:47 | 显示全部楼层
我是来打酱油的
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-12-26 22:26:24 | 显示全部楼层    本楼为最佳答案   
本帖最后由 阴阳神万物主 于 2019-12-26 23:11 编辑

值这么些鱼币?
代码:
  1. def finding(a:'文件路径'=r'./A.txt',b:'文件路径'=r'./B.txt',c:'文件路径'=r'./C.txt'):
  2.     f1 = open(a)
  3.     f2 = open(b)
  4.     f3 = open(c,'w')
  5.     for line in f1:
  6.         code,num = line.split()
  7.         na,nb = num.split('-')
  8.         na = int(na)-1
  9.         nb = int(nb)
  10.         f2.seek(0)
  11.         while True:
  12.             linb = f2.readline()
  13.             if linb[0] == '>':
  14.                 if code == linb[1:-1]:
  15.                     break
  16.         linb = f2.readline()
  17.         linb = linb[:-1] if linb[-1] == '\n' else linb
  18.         f3.write('>'+(line if line[-1]=='\n' else (line+'\n')))
  19.         f3.write(linb[na:nb]+'\n')
  20.     f1.close()
  21.     f2.close()
  22.     f3.close()
  23.     print('over')
复制代码
反正我这里运行没毛病

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-12-26 22:34:25 | 显示全部楼层
本帖最后由 hrp 于 2019-12-26 22:56 编辑
  1. with open('A.txt', 'rt', encoding='utf-8') as A:
  2.     Alines = A.readlines()
  3.     A.close()
  4. listA = []
  5. for i1 in Alines:
  6.     i1 = i1.strip().split(' ')
  7.     i2 = i1[-1].split('-')
  8.     listA.append(
  9.         (i1[0], int(i2[0]), int(i2[1]))
  10.     )
  11. #print(listA)

  12. with open('B.txt', 'rt', encoding='utf-8') as B:
  13.     Blines = B.readlines()
  14.     B.close()
  15. listB = []
  16. for i in range(0, len(Blines), 2):
  17.     listB.append(
  18.         (Blines[i].strip(), Blines[i+1].strip())
  19.     )
  20. #print(listB)

  21. for i in listA:
  22.     for j in listB:
  23.         if j[0][1:] == i[0]:
  24.             print(j[0], '\t', str(i[1])+'-'+str(i[2]))
  25.             print(j[1][i[1]-1:i[2]])
复制代码
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-12-26 22:48:22 | 显示全部楼层

回帖奖励 +20 鱼币

本帖最后由 Stubborn 于 2019-12-26 23:45 编辑

读出来不是字符串吗? 直接截取就好啦呀,A的话,得处理下,获得int的 起始和结果 3-6  比如 3和6得分别提取出来

  1. f_a = open("A.te", "r", encoding="utf-8")
  2. f_b = open("B.te", "r", encoding="utf-8")
  3. sequence = [x.strip("\n") for x in f_b ]
  4. print(sequence)
  5. for idx,val in enumerate(f_a):
  6.     start, end = val.strip("\n").split("-")
  7.     print(sequence[idx][int(start):int(end)])
复制代码
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-12-26 23:30:36 | 显示全部楼层

回帖奖励 +20 鱼币

  1. fileA = '''A        3-6
  2. A        8-12
  3. C        2-5
  4. D        1-22'''
  5. fileB = '''>A
  6. CDFEGHFSDFMKDSVFDJFSDNCVNJJSDFHSDFDSNVCVSDLDJFISADKLFDDN
  7. >B
  8. dfweiuffhdvdofioejerjngvfhuvdlssfdsjvfmncvvm
  9. >C
  10. SDFOIJSNFVDVMLGIFU8RJVOFVKSDOPIJVCSDUIVNVJUISDPJVHNDSISDJDSIOUVJHCSDLI
  11. >D
  12. EWREDUSFHUDSIHFDSLFLDSNVJSVBHIYFCHUSDBKHSDKVSDYVSDNVBKHSDFVSDUVHDSVSDVJNBDSLHV'''


  13. fileAlist = fileA.split('\n');
  14. fileBlist = fileB.split('\n');

  15. for strA in fileAlist:
  16.     s1, s2 = strA.split()
  17.    
  18.     i1, i2 = s2.split('-')
  19.    
  20.     i1 = int(i1) - 1
  21.     i2 = int(i2)


  22.     for i, strB in enumerate(fileBlist):        
  23.         if i % 2 == 0:      
  24.             if s1 in strB:
  25.                 print(strB + '        ' + s2)        
  26.                 print(fileBlist[i+1][i1:i2])

  27.             
  28.         
复制代码
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-12-27 11:09:32 | 显示全部楼层
来看大佬们的答案
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-12-27 11:41:17 | 显示全部楼层
新人来打酱油
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-4-24 18:34

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表