麻麦皮 发表于 2020-4-20 00:38:51

淘宝爬虫的正则表达式

import re
def main():
    with open('items.txt','r',encoding='utf-8') as file1:
      g_page_config=re.search(r'g_page_config = (.*?);\n',file1.read())
      with open('g_page_config.txt','w',encoding='utf-8') as file2:
            file2.write(g_page_config.group(1))
g_page_config=re.search(r'g_page_config = (.*?);\n',file1.read())的(.*?);\n是什么意思

zltzlt 发表于 2020-4-20 08:00:06

\n 不表示换行,它表示 \\n,打印出来效果是 \n

>>> print(r'123\n\n\n456')
123\n\n\n456

会计的会怎么念 发表于 2020-4-20 09:33:38

小甲鱼总结的正则表达式特殊符号及用法

悠悠2264 发表于 2020-4-20 10:08:34

.表示任意一个字符(除空格),*?表示匹配前面的.零次或多次,并开启非贪婪模式(匹配最少的),“;\n”表示匹配里面的“;\n”
页: [1]
查看完整版本: 淘宝爬虫的正则表达式