鱼C论坛

 找回密码
 立即注册
查看: 2631|回复: 3

关于正则表达式的问题

[复制链接]
发表于 2021-5-22 01:19:45 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
本帖最后由 傲视群熊¥ 于 2021-5-22 14:24 编辑

def find_data(res):
    data = []
    soup = bs4.BeautifulSoup(res.text, "html.parser")
    content = soup.find(id="Cnt-Main-Article-QQ")
    target = iter(content.find_all("p", style="TEXT-INDENT: 2em"))
    for each in target:
        if each.text.isnumeric():
            data.append([
                re.search(r'\[(.+)\]', next(target).text).group(1),
                re.search(r'\d.*', next(target).text).group(),
                re.search(r'\d.*', next(target).text).group(),
                re.search(r'\d.*', next(target).text).group()
                ])

    return data
以上的代码是鱼哥在爬取2017 年中国主要城市房价工资比排行榜的时候写的。想请教大佬为啥”re.search(r'\[(.+)\]', next(target).text).group(1)“中既用了r,又用了\。r不是已经将后面的字符串转为原生zi'fu
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2021-5-22 09:38:12 | 显示全部楼层
把待爬取的信息源码发上来,对照待爬取的信息看才能看出为什么,你这样没法给你解答,总不能又返回去看视频吧?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2021-5-22 09:50:31 | 显示全部楼层
正则前面就得加r   比如你匹配小数点 得用 r'\.'
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2021-5-22 11:52:16 | 显示全部楼层
笨鸟学飞 发表于 2021-5-22 09:38
把待爬取的信息源码发上来,对照待爬取的信息看才能看出为什么,你这样没法给你解答,总不能又返回去看视频 ...

就类似这些
屏幕截图 2021-05-22 115037.png
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-1-15 06:52

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表