[已解决]for循环中print函数没有作用

高家伟 · 发表于 2017-3-21 22:17:27

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

在写一个爬虫练习的时候，卡住了，我写了下面一段程序，

url = 'http://www.tripadvisor.cn/Attractions-g294212-Activities-Beijing.html'
wb_data = requests.get(url)
soup = BeautifulSoup(wb_data.text, 'lxml')
titles = soup.select('div.property_title > a')
imgs = soup.select('img[width="160"]') #等号两边不能有空格
cates = soup.select('div.p13n_reasoning_v2>')
for title, img, cate in zip(titles, imgs, cates):
data = {
'title':title.get_text(),
'img':img.get('src'),
'cate':list(cate.stripped_strings),
}
print(data)

复制代码

在for循环之前程序没有任何问题，我单独试过

print(title.get_text())
print(img.get('src'))
print(list(cate.stripped_strings))

复制代码

都没有出现问题，但是一打包之后，就输出不了。

pycharm显示

Process finished with exit code 0

复制代码

python自带idle就没有显示，不知道是哪里出了问题，真心求教。

最佳答案

月排行榜 / 总排行榜

lumber2388779

2017-3-22 09:12:51

我试着用你的程序爬了下，发现你的cates一直是空的，而zip是根据你打包的列表最短长度组成新的迭代，由于你的cates一直是空的，所以zip打包完实际是没有元素的
zip用法参考下http://www.cnblogs.com/frydsh/archive/2012/07/10/2585370.html
我试着将你的titles，imgs，cates元素长度打印出来分别是30,24,0 长度不一这样用zip会有问题的，修改下你爬取的地方吧，做到长度一致，要么不要用zip函数

跳转到最佳答案楼层

lumber2388779 · 发表于 2017-3-22 09:12:51

这个最佳答案由 lumber2388779 给出，感谢 lumber2388779 的回答。

单击隐藏图章

我试着用你的程序爬了下，发现你的cates一直是空的，而zip是根据你打包的列表最短长度组成新的迭代，由于你的cates一直是空的，所以zip打包完实际是没有元素的
zip用法参考下http://www.cnblogs.com/frydsh/archive/2012/07/10/2585370.html
我试着将你的titles，imgs，cates元素长度打印出来分别是30,24,0 长度不一这样用zip会有问题的，修改下你爬取的地方吧，做到长度一致，要么不要用zip函数

高家伟 · 发表于 2017-3-22 09:24:19

lumber2388779 发表于 2017-3-22 09:12
我试着用你的程序爬了下，发现你的cates一直是空的，而zip是根据你打包的列表最短长度组成新的迭代，由于你 ...

谢谢你的提示，我找到了错误，cates抓取的时候，原来后面还有一个子标签，但是为了抓取多个，就把他删除了，但是剩了一个'>'没有删，导致Cates没有抓取到任何东西。

账号		自动登录	找回密码
密码			立即注册

[已解决]for循环中print函数没有作用

马上注册，结交更多好友，享用更多功能^_^

浏览过的版块