[已解决]初学爬虫遇到的简单问题

密发小和尚 · 发表于 2017-12-2 18:15:08

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

from bs4 import BeautifulSoup
import requests
url = 'http://www.ivsky.com/tupian/xiaomai_t3811/'
r = requests.get(url)
soup = BeautifulSoup(r.text,'lxml')
imgs = soup.select('body > div:nth-of-type(3) > div.left > ul')
for img in zip(imgs):
data ={img.get('src')}
print(data)

复制代码

出现错误：AttributeError: 'tuple' object has no attribute 'get'
大神们能说说我的问题出在哪里吗？
我是在https://www.bilibili.com/video/av14109284/index_3.html?t=964上学的，跟15：38的代码相似，为什么我的会出错？

最佳答案

月排行榜 / 总排行榜

坏小子

2017-12-3 21:09:57

本帖最后由坏小子于 2017-12-3 21:43 编辑

密发小和尚发表于 2017-12-2 19:23
是imgs吧，得到的是{None}，是爬取失败还是什么的？

啊不好意思，确实是imgs

我把完整的能提取链接的代码贴出来吧

# -*- coding: utf-8 -*-
from bs4 import BeautifulSoup
import requests
url = 'http://www.ivsky.com/tupian/xiaomai_t3811/'
r = requests.get(url)
soup = BeautifulSoup(r.text,'lxml')
#这是楼主的提取方法
imgs = soup.select('body > div:nth-of-type(3) > div.left > ul')
l=[]
for img in imgs:
l.append(img.attrs)
data ={img.attrs.get('src')}
print(data)
print(l)
#这是我的提取方法
l=soup.find_all(name='img')
for x in l:
print(unicode(x))
imgs=l
data=[]
for img in imgs:
data.append(img.attrs.get('src'))
print(data)

复制代码

跳转到最佳答案楼层

坏小子 · 发表于 2017-12-2 18:44:52

把zip(imgs)改成img

密发小和尚 · 发表于 2017-12-2 19:23:01

坏小子发表于 2017-12-2 18:44
把zip(imgs)改成img

是imgs吧，得到的是{None}，是爬取失败还是什么的？

坏小子 · 发表于 2017-12-3 21:09:57

本帖最后由坏小子于 2017-12-3 21:43 编辑

密发小和尚发表于 2017-12-2 19:23
是imgs吧，得到的是{None}，是爬取失败还是什么的？

啊不好意思，确实是imgs

我把完整的能提取链接的代码贴出来吧

# -*- coding: utf-8 -*-
from bs4 import BeautifulSoup
import requests
url = 'http://www.ivsky.com/tupian/xiaomai_t3811/'
r = requests.get(url)
soup = BeautifulSoup(r.text,'lxml')
#这是楼主的提取方法
imgs = soup.select('body > div:nth-of-type(3) > div.left > ul')
l=[]
for img in imgs:
l.append(img.attrs)
data ={img.attrs.get('src')}
print(data)
print(l)
#这是我的提取方法
l=soup.find_all(name='img')
for x in l:
print(unicode(x))
imgs=l
data=[]
for img in imgs:
data.append(img.attrs.get('src'))
print(data)

复制代码

账号		自动登录	找回密码
密码			立即注册