关于正则再爬虫当中的使用

青柠南瓜 · 发表于 2017-10-30 18:48:11

您需要登录才可以下载或查看，没有账号？立即注册

x

最近想结合专业做一个爬虫，就去找和古文相关的网站，不过在爬取书本章节内容的时候出了点问题，正则表达式匹配不上相关内容，返回一个空列表给我。还请各位帮一下忙，看看哪里出了问题？

青柠南瓜 · 发表于 2017-10-30 18:49:51

上面的附件是要爬网站的代码，我写的正则是：
reg = r'.*?</div>(.*?)'
reg = re.compile(reg,re.S)
chapterContent = re.findall(reg,html)
不知道怎么修改

账号		自动登录	找回密码
密码			立即注册