[已解决]python爬豆瓣图书毫无反应，也没报错

suishoufang · 发表于 2018-3-28 17:17:51

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

爬虫代码：
import requests
import re
content = requests.get('https://book.douban.com/').text
pattern = re.compile('<li.?cover.?href="(.?)".?title="(.?)".?more-meta.?author">(.?).?year">(.?).*?<li>',re.S)
results = re.findall(pattern,content)
print(results)
for result in results:

url,name,author,date = result
author = re.sub('\s',author)
date = re.sub('\s','',date)
print(url,name,author,date)

执行一直显示在执行，但毫无结果，也没报错，等一个小时还在执行，求大神帮忙看看问题出在哪

最佳答案

月排行榜 / 总排行榜

ba21

2018-3-28 20:23:22

一看就知道正则没写对，看下面代码的正则：

import requests
import re
content = requests.get('https://book.douban.com/').text
pattern = re.compile(r'<li class="">.*?<div class="cover">.*?<a href="(.+?)" title="(.+?)".*?(.+?).*?(.+?).*?</li>',re.S)
results = re.findall(pattern,content)
for result in results:
url,name,author,date = result
print(url)
print(name)
print(author)
print(date)

复制代码

跳转到最佳答案楼层

wongyusing · 发表于 2018-3-28 19:45:42

你的格式有问题
for result in results:
下面的代码不用缩进？？？
还是说你没有按照格式发帖？

ba21 · 发表于 2018-3-28 20:23:22

一看就知道正则没写对，看下面代码的正则：

import requests
import re
content = requests.get('https://book.douban.com/').text
pattern = re.compile(r'<li class="">.*?<div class="cover">.*?<a href="(.+?)" title="(.+?)".*?(.+?).*?(.+?).*?</li>',re.S)
results = re.findall(pattern,content)
for result in results:
url,name,author,date = result
print(url)
print(name)
print(author)
print(date)

复制代码

账号		自动登录	找回密码
密码			立即注册

[已解决]python爬豆瓣图书毫无反应，也没报错

马上注册，结交更多好友，享用更多功能^_^

浏览过的版块