鱼C论坛

 找回密码
 立即注册
查看: 2490|回复: 1

哪位大神知道如何将两个文件中根据相同序列ID将序列合并

[复制链接]
发表于 2018-4-24 17:13:14 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
我有A、B两个文件,序列ID按照顺序都一致,现在想将两个文件按照相同的ID将序列以换行符合并,求哪位大神指导
A文件
>1_CHROMOSOME3780765_3785720
tgttgaaagttaaacttgattttgaatcaagtttaattattggatcaattatccaataat
taattatggccaaatccaagttctagagttttctctagaaatatcatcatttccacctcc
>1_CHROMOSOME5691759_5696703
taaatacctaaccggtttgttccgggttaattaggttagatagggaaagtgtatataatg
tcttgtattcactctttaataagataacagaaacattttccactttcggctccttacatt
B文件
>1_CHROMOSOME3780765_3785720
tgttgaaagttaaacttgattttgaatcaagtttaattattggatcaattatccaataat
taatta
>1_CHROMOSOME5691759_5696703
ttgttaatacctaaccggtttgttccgggttaattaggttagatagagaaaatgtatata
atgtcttgtattca
我想得到C文件如下
>1_CHROMOSOME3780765_3785720
tgttgaaagttaaacttgattttgaatcaagtttaattattggatcaattatccaataat
taattatggccaaatccaagttctagagttttctctagaaatatcatcatttccacctcc
tgttgaaagttaaacttgattttgaatcaagtttaattattggatcaattatccaataat
taatta
>1_CHROMOSOME5691759_5696703
taaatacctaaccggtttgttccgggttaattaggttagatagggaaagtgtatataatg
tcttgtattcactctttaataagataacagaaacattttccactttcggctccttacatt
ttgttaatacctaaccggtttgttccgggttaattaggttagatagagaaaatgtatata
atgtcttgtattca
就是以换行符将相同序列ID的序列合并了,求大神指导
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2018-4-24 18:48:20 | 显示全部楼层
  1. #把文件转换成字典
  2. def get_dict(file):
  3.     t_dict = {}
  4.     with open(file, "r") as f:
  5.         txt = f.read()
  6.         txt_list = txt.split('>')
  7.         for item in txt_list:
  8.             if item != '':
  9.                 item_list=item.splitlines()
  10.                 temp_txt = ''
  11.                 for i in range(len(item_list)):
  12.                     if i == 0:
  13.                         id_txt= '<' + item_list[i] + '\n'
  14.                     else:
  15.                         temp_txt += item_list[i] + '\n'
  16.                 t_dict[id_txt] = temp_txt
  17.     return t_dict
  18.             
  19. #获取2两文件的内容,转换成字典保存
  20. a_dict = get_dict("a.txt")
  21. b_dict = get_dict("b.txt")

  22. #把b_dict中的值合并到a_dict中
  23. for k, v in b_dict.items():
  24.     if k in a_dict.keys():
  25.         a_dict[k] += v

  26. #把合并后的内容写入文件         
  27. with open("c.txt", "w") as f:
  28.     for k, v in a_dict.items():
  29.         f.writelines(k)
  30.         f.writelines(v)
复制代码
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-4-20 18:37

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表