[已解决]python爬取网页时报对象没有属性但是网页中有此元素

moyk · 发表于 2019-4-3 16:14:56

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

1.网站：http://cp.zgzcw.com/lottery/jchtplayvsForJsp.action?lotteryId=48&type=jcmini&issue=2019-03-06
2.代码：
import re
import bs4
import requests
#读取网页
http="http://cp.zgzcw.com/lottery/jchtplayvsForJsp.action?lotteryId=48&type=jcmini&issue=2019-03-06"
visit = requests.get(http)
parser = bs4.BeautifulSoup(visit.text, "html.parser")
#主队Home team

def Visiting_team():
targets = parser.find_all("td",class_="wh-6 t-l")
for each in targets:
print(each.a.text)
return

#输出
Visiting_team()

最佳答案

月排行榜 / 总排行榜

1239890175

2019-4-8 14:19:58

本帖最后由 1239890175 于 2019-4-8 14:28 编辑

import re
import bs4
import requests
def Visiting_team(parser):
targets = parser.find_all("td", attrs={'class':"wh-6 t-l"})
for each in targets:
print(each.a.text)
#读取网页
http="http://cp.zgzcw.com/lottery/jchtplayvsForJsp.action?lotteryId=48&type=jcmini&issue=2019-03-06"
visit = requests.get(http)
parser = bs4.BeautifulSoup(visit.text, "lxml")
#主队Home team
#输出
Visiting_team(parser)

复制代码

主要的问题

跳转到最佳答案楼层

wongyusing · 发表于 2019-4-3 18:39:26

这是js渲染出来的元素，用不了bs4

mongoole · 发表于 2019-4-3 19:04:44

看看网页源代码里面有没有

moyk · 发表于 2019-4-8 11:22:24

mongoole 发表于 2019-4-3 19:04
看看网页源代码里面有没有

网页源代码里有，但是代码里爬不出来

moyk · 发表于 2019-4-8 11:23:12

wongyusing 发表于 2019-4-3 18:39
这是js渲染出来的元素，用不了bs4

请大神指导下，我该怎么写啊

efeng8411676 · 发表于 2019-4-8 11:56:38

我也在爬类似的数据，同问

moyk · 发表于 2019-4-8 12:21:44

efeng8411676 发表于 2019-4-8 11:56
我也在爬类似的数据，同问

幸会幸会

1239890175 · 发表于 2019-4-8 14:19:58

这个最佳答案由 1239890175 给出，感谢 1239890175 的回答。

单击隐藏图章

本帖最后由 1239890175 于 2019-4-8 14:28 编辑

import re
import bs4
import requests
def Visiting_team(parser):
targets = parser.find_all("td", attrs={'class':"wh-6 t-l"})
for each in targets:
print(each.a.text)
#读取网页
http="http://cp.zgzcw.com/lottery/jchtplayvsForJsp.action?lotteryId=48&type=jcmini&issue=2019-03-06"
visit = requests.get(http)
parser = bs4.BeautifulSoup(visit.text, "lxml")
#主队Home team
#输出
Visiting_team(parser)

复制代码

主要的问题

mongoole · 发表于 2019-4-8 14:21:39

你需要的是图示的内容吧：
我对bs4不是太熟悉。。。这些数据可以用xpath拿出来的
希望对你有用。
部分代码：

#coding:utf-8
import requests
from lxml import etree
url = 'http://cp.zgzcw.com/lottery/jchtplayvsForJsp.action?lotteryId=48&type=jcmini&issue=2019-03-06'
headers = {
'User-Agent': 'Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; AcooBrowser; .NET CLR 1.1.4322; .NET CLR 2.0.50727)'}
html = requests.get(url, headers=headers).text
selector = etree.HTML(html)
number = selector.xpath('//*[@id="hide_box_1"]/tbody/tr/td[1]/a/i/text()')
competition = selector.xpath('//*[@id="hide_box_1"]/tbody/tr/td[2]/span/text()')
score = selector.xpath('//*[@id="hide_box_1"]/tbody/tr/td[3]/span[1]/text()')
print(number,competition,score)

复制代码

wongyusing · 发表于 2019-4-8 14:27:30

moyk 发表于 2019-4-8 11:23
请大神指导下，我该怎么写啊

我看错了，擦。
你用bs4的select方法来select tbody标签就行了。
也可以用pandas直接获取

moyk · 发表于 2019-4-8 15:55:16

mongoole 发表于 2019-4-8 14:21
你需要的是图示的内容吧：
我对bs4不是太熟悉。。。这些数据可以用xpath拿出来的
希望对你有用。

非常感谢，但是我没学过这lxml解析数据

moyk · 发表于 2019-4-8 16:09:38

1239890175 发表于 2019-4-8 14:19
主要的问题

parser = bs4.BeautifulSoup(visit.text, "lxml") "lxml"是什么意思啊

1239890175 · 发表于 2019-4-8 16:22:04

moyk 发表于 2019-4-8 16:09
parser = bs4.BeautifulSoup(visit.text, "lxml") "lxml"是什么意思啊

解析方式，详情直接百度

账号		自动登录	找回密码
密码			立即注册

[已解决]python爬取网页时报对象没有属性但是网页中有此元素

马上注册，结交更多好友，享用更多功能^_^

浏览过的版块