|
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
您好,我有一个A.txt 其中的一行数据如下“词典示例内容”所示。我想读取A.txt 提取以“【”符号开始以“᠃”符号结束的中间内容。其中让人头疼的是“【”符号后面有多个“᠃”符号的情况。这时,我想提取最后面那个“᠃”和“【”中间的内容。然后一个数据一行的保存。希望得到您的帮助,谢谢。
词典示例内容:(不是乱码,时utf-8的文本)
ᠶᠡᠭᠡ#их ᠪᠡᠭ᠎ᠠ ᠭᠡᠳᠡᠭ ᠲᠡᠢ ᠡᠰᠡᠷᠬᠦᠴᠡᠯᠳᠦᠭᠰᠡᠠ ᠤᠤᠡᠬ᠎ᠠ᠃ ① ᠭᠡᠮᠵᠢᠶ᠎ᠠ ᠪᠡᠷ ᠤᠢᠯᠡᠮᠵᠢ᠄ ᠶᠡᠭᠡ ᠬᠤᠳᠠ; ᠶᠡᠭᠡ ᠤᠰᠦᠳᠡᠢ ᠭᠤᠦᠯ; ᠶᠡᠭᠡ ᠭᠤᠪᠢ ᠵᠢᠠ ᠵᠤᠷᠢᠬᠳᠡᠠ᠃ 【ᠶᠡᠭᠡ ᠪᠡᠶ᠎ᠠ】 ᠬᠦᠪᠴᠢᠠ ᠪᠡᠶ᠎ᠠ᠃ 【ᠶᠡᠭᠡ ᠪᠡᠷᠢᠯᠭ᠎ᠠ】 ᠰᠢᠨ᠎ᠡ ᠪᠡᠷ ᠪᠡᠷᠢᠬᠤ ᠪᠡᠷᠢᠯᠭ᠎ᠠ᠄ ᠶᠡᠭᠡ ᠪᠡᠷᠢᠯᠭ᠎ᠠ ᠵᠢᠠ ᠭᠡᠯᠳᠡᠰ; ᠪᠡᠷᠢᠯᠭ᠎ᠠ ᠵᠢᠠ ᠲᠤᠢᠯᠦᠪᠯᠡᠭᠡ᠃ 【ᠶᠡᠭᠡ ᠲᠡᠯᠭᠡᠬᠦᠷ】 ᠲᠤᠢᠷᠦᠯ ᠪᠦᠷᠢ ᠵᠢᠠ ᠪᠡᠷᠡᠭ᠎ᠠ ᠶᠡᠭᠤᠮ᠎ᠠ ᠬᠤᠳᠡᠯᠳᠦᠬᠤ ᠲᠡᠯᠭᠡᠬᠦᠷ᠃ 【ᠶᠡᠭᠡ ᠫᠤᠦ】 ᠰᠤᠮᠦ ᠨᠢ ᠬᠤᠯᠠ ᠭᠠᠵᠡᠷ ᠨᠢᠰᠬᠦ ᠨᠢᠭᠡ ᠵᠤᠢᠢᠯ ᠲᠤᠮᠦ ᠫᠤᠦ᠄ ᠲᠡᠩᠺ ᠡᠰᠡᠷᠬᠦᠴᠡᠬᠦ ᠶᠡᠭᠡ ᠫᠤᠦ᠃ 【ᠶᠡᠭᠡ ᠪᠦᠷᠢᠶ᠎ᠠ】 ᠪᠦᠳᠦᠬᠦᠠ ᠲᠤᠤᠭᠠᠷᠡᠬᠤ ᠨᠢᠭᠡ ᠵᠤᠢᠢᠯ ᠤᠢᠯᠢᠶᠡᠪᠦᠷᠢ ᠬᠦᠭᠵᠢᠮ ᠤᠨ ᠵᠡᠪᠰᠡᠭ᠃ 【ᠶᠡᠭᠡ ᠴᠡᠷᠢᠭ】 А ᠡᠯᠳᠡᠪ ᠵᠡᠪᠰᠡᠭ ᠪᠦᠬᠦᠢ ᠤᠢᠯᠡᠮᠵᠢ ᠴᠡᠷᠢᠭ᠃ Б ᠭᠤᠦᠯ ᠬᠦᠴᠦᠠ᠃
想要得到的结果:
【ᠶᠡᠭᠡ ᠪᠡᠶ᠎ᠠ】 ᠬᠦᠪᠴᠢᠠ ᠪᠡᠶ᠎ᠠ᠃
【ᠶᠡᠭᠡ ᠪᠡᠷᠢᠯᠭ᠎ᠠ】 ᠰᠢᠨ᠎ᠡ ᠪᠡᠷ ᠪᠡᠷᠢᠬᠤ ᠪᠡᠷᠢᠯᠭ᠎ᠠ᠄ ᠶᠡᠭᠡ ᠪᠡᠷᠢᠯᠭ᠎ᠠ ᠵᠢᠠ ᠭᠡᠯᠳᠡᠰ; ᠪᠡᠷᠢᠯᠭ᠎ᠠ ᠵᠢᠠ ᠲᠤᠢᠯᠦᠪᠯᠡᠭᠡ᠃
【ᠶᠡᠭᠡ ᠲᠡᠯᠭᠡᠬᠦᠷ】 ᠲᠤᠢᠷᠦᠯ ᠪᠦᠷᠢ ᠵᠢᠠ ᠪᠡᠷᠡᠭ᠎ᠠ ᠶᠡᠭᠤᠮ᠎ᠠ ᠬᠤᠳᠡᠯᠳᠦᠬᠤ ᠲᠡᠯᠭᠡᠬᠦᠷ᠃
【ᠶᠡᠭᠡ ᠫᠤᠦ】 ᠰᠤᠮᠦ ᠨᠢ ᠬᠤᠯᠠ ᠭᠠᠵᠡᠷ ᠨᠢᠰᠬᠦ ᠨᠢᠭᠡ ᠵᠤᠢᠢᠯ ᠲᠤᠮᠦ ᠫᠤᠦ᠄ ᠲᠡᠩᠺ ᠡᠰᠡᠷᠬᠦᠴᠡᠬᠦ ᠶᠡᠭᠡ ᠫᠤᠦ᠃
【ᠶᠡᠭᠡ ᠪᠦᠷᠢᠶ᠎ᠠ】 ᠪᠦᠳᠦᠬᠦᠠ ᠲᠤᠤᠭᠠᠷᠡᠬᠤ ᠨᠢᠭᠡ ᠵᠤᠢᠢᠯ ᠤᠢᠯᠢᠶᠡᠪᠦᠷᠢ ᠬᠦᠭᠵᠢᠮ ᠤᠨ ᠵᠡᠪᠰᠡᠭ᠃
【ᠶᠡᠭᠡ ᠴᠡᠷᠢᠭ】 А ᠡᠯᠳᠡᠪ ᠵᠡᠪᠰᠡᠭ ᠪᠦᠬᠦᠢ ᠤᠢᠯᠡᠮᠵᠢ ᠴᠡᠷᠢᠭ᠃ Б ᠭᠤᠦᠯ ᠬᠦᠴᠦᠠ᠃
本帖最后由 人造人 于 2021-11-24 20:11 编辑
- >>> text
- '【AB】11111111111.【CC】A2222222222.B3333333333.'
- >>> re.findall(r'【[^【]*', text)
- ['【AB】11111111111.', '【CC】A2222222222.B3333333333.']
- >>>
复制代码
|
|