|
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
import requests
import bs4
r = requests.get('http://www.imdb.cn/IMDB250/')
soup = bs4.BeautifulSoup(r.text,"html.parser")
targets = soup.find_all('div',class_='ss-3 clear')
for each in targets:
print(each.a.p.text)
因为豆瓣网爬不到了,获取网页然后.text是一个空列表,我就去爬了IMDB电影top250,跟着书上得步骤一步一步写出了如上得代码,但是问题出现了!无论如何,这段代码只能爬到第一部电影《肖申克得救赎》。我思考了很久尝试了很多次,发现target是一个列表,但是只有一个元素,虽然包含了整个网页得所有文本,但是一个元素不能迭代出每部电影得名字,是不是soup.find_all没用好啊,有没有爬电影250成功了得同学解救一下我啊……
targets = soup.find_all('p',class_='bb')
这个就是每个电影的名字,你是要这个么
|
|