鱼C论坛

 找回密码
 立即注册
查看: 2925|回复: 1

哪位大神知道如何将两个文件中根据相同序列ID将序列合并

[复制链接]
发表于 2018-4-24 17:13:14 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
我有A、B两个文件,序列ID按照顺序都一致,现在想将两个文件按照相同的ID将序列以换行符合并,求哪位大神指导
A文件
>1_CHROMOSOME3780765_3785720
tgttgaaagttaaacttgattttgaatcaagtttaattattggatcaattatccaataat
taattatggccaaatccaagttctagagttttctctagaaatatcatcatttccacctcc
>1_CHROMOSOME5691759_5696703
taaatacctaaccggtttgttccgggttaattaggttagatagggaaagtgtatataatg
tcttgtattcactctttaataagataacagaaacattttccactttcggctccttacatt
B文件
>1_CHROMOSOME3780765_3785720
tgttgaaagttaaacttgattttgaatcaagtttaattattggatcaattatccaataat
taatta
>1_CHROMOSOME5691759_5696703
ttgttaatacctaaccggtttgttccgggttaattaggttagatagagaaaatgtatata
atgtcttgtattca
我想得到C文件如下
>1_CHROMOSOME3780765_3785720
tgttgaaagttaaacttgattttgaatcaagtttaattattggatcaattatccaataat
taattatggccaaatccaagttctagagttttctctagaaatatcatcatttccacctcc
tgttgaaagttaaacttgattttgaatcaagtttaattattggatcaattatccaataat
taatta
>1_CHROMOSOME5691759_5696703
taaatacctaaccggtttgttccgggttaattaggttagatagggaaagtgtatataatg
tcttgtattcactctttaataagataacagaaacattttccactttcggctccttacatt
ttgttaatacctaaccggtttgttccgggttaattaggttagatagagaaaatgtatata
atgtcttgtattca
就是以换行符将相同序列ID的序列合并了,求大神指导
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2018-4-24 18:48:20 | 显示全部楼层
#把文件转换成字典
def get_dict(file):
    t_dict = {}
    with open(file, "r") as f:
        txt = f.read()
        txt_list = txt.split('>')
        for item in txt_list:
            if item != '':
                item_list=item.splitlines()
                temp_txt = ''
                for i in range(len(item_list)):
                    if i == 0:
                        id_txt= '<' + item_list[i] + '\n'
                    else:
                        temp_txt += item_list[i] + '\n'
                t_dict[id_txt] = temp_txt
    return t_dict
            
#获取2两文件的内容,转换成字典保存
a_dict = get_dict("a.txt")
b_dict = get_dict("b.txt")

#把b_dict中的值合并到a_dict中
for k, v in b_dict.items():
    if k in a_dict.keys():
        a_dict[k] += v

#把合并后的内容写入文件          
with open("c.txt", "w") as f:
    for k, v in a_dict.items():
        f.writelines(k)
        f.writelines(v)
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-12-23 19:36

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表