[已解决]BS4库.children报错

Ryan_Li · 发表于 2020-1-18 14:56:07

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

for tr in soup.find('tbody').children:
这里.children报错是怎么回事
AttributeError: 'NoneType' object has no attribute 'children'

之前对于soup相关的函数：
def getHTMLText(url):
try:
      r=requests.get(url,30)
      r.raise_for_status()
      r.encoding=r.apparent_encoding
      return r.text
except:
      return"产生错误：url调用"
return ""

html=getHTMLText(url)

soup=BeautifulSoup(html,"html.parser")

之后for tr in soup.find('tbody').children:这里就报错了

最佳答案

月排行榜 / 总排行榜

zltzlt

2020-1-18 15:32:08

这样可以了：

import requests
from bs4 import BeautifulSoup
import os
import bs4
def getHTMLText(url):
try:
r = requests.get(url)
return r.content.decode("utf-8")
except Exception:
return "产生错误：url调用"
def fillUnivList(ulist, html):
soup = BeautifulSoup(html, "html.parser")
for tr in soup.find('tbody'):
if isinstance(tr, bs4.element.Tag):
tds = tr("td")
if tds:
ulist.append([tds[0].string, tds[1].string, tds[3].string])
def output(ulist):
print("{:^10}\t{:^6}\t{:^10}".format("排名", "学校名称", "总分"))
for u in ulist:
print("{:^10}\t{:^6}\t{:^10}".format(u[0], u[1], u[2]))
def main():
uinfo = []
url = "http://www.zuihaodaxue.com/zuihaodaxuepaiming2016.html"
html = getHTMLText(url)
fillUnivList(uinfo, html)
output(uinfo)
main()

复制代码

跳转到最佳答案楼层

Ryan_Li · 发表于 2020-1-18 15:08:17

以下是源代码

import requests
from bs4 import BeautifulSoup
import os
import bs4
def getHTMLText(url):
try:
r=requests.get(url,30)
r.raise_for_status()
r.encoding=r.apparent_encoding
return r.text
except:
return"产生错误：url调用"
return ""
def fillUnivList(ulist,html):
soup=BeautifulSoup(html,"html.parser")
for tr in soup.find('tbody').children:
if isinstance(tr,bs4.element.Tag):
tds=tr("td")
ulist.append([tds[0].string,tds[1].string,tds[2].string])
def output(ulist,num):
print("{:^10]\t{:^6]\t{:^10]}".format("排名","学校名称","总分"))
for i in range(num):
u=ulist[i]
print("{:^10]\t{:^6]\t{:^10]}".format(u[0],u[1],u[2]))
def main():
uinfo=[]
url="http://www.zuihaodaxue.com/zuihaodaxuepaiming2016.html"
html=getHTMLText(url)
fillUnivList(uinfo,html)
output(uinfo,20)
main()

复制代码

zltzlt · 发表于 2020-1-18 15:32:08

这个最佳答案由 zltzlt 给出，感谢 zltzlt 的回答。

单击隐藏图章

这样可以了：

import requests
from bs4 import BeautifulSoup
import os
import bs4
def getHTMLText(url):
try:
r = requests.get(url)
return r.content.decode("utf-8")
except Exception:
return "产生错误：url调用"
def fillUnivList(ulist, html):
soup = BeautifulSoup(html, "html.parser")
for tr in soup.find('tbody'):
if isinstance(tr, bs4.element.Tag):
tds = tr("td")
if tds:
ulist.append([tds[0].string, tds[1].string, tds[3].string])
def output(ulist):
print("{:^10}\t{:^6}\t{:^10}".format("排名", "学校名称", "总分"))
for u in ulist:
print("{:^10}\t{:^6}\t{:^10}".format(u[0], u[1], u[2]))
def main():
uinfo = []
url = "http://www.zuihaodaxue.com/zuihaodaxuepaiming2016.html"
html = getHTMLText(url)
fillUnivList(uinfo, html)
output(uinfo)
main()

复制代码

Ryan_Li · 发表于 2020-1-18 15:42:11

zltzlt 发表于 2020-1-18 15:32
这样可以了：

感谢！可以告诉我的代码哪里错了吗

zltzlt · 发表于 2020-1-18 15:43:00

Ryan_Li 发表于 2020-1-18 15:42
感谢！可以告诉我的代码哪里错了吗

这一部分有问题。

r=requests.get(url,30)
r.raise_for_status()
r.encoding=r.apparent_encoding
return r.text

复制代码

Ryan_Li · 发表于 2020-1-18 15:47:23

zltzlt 发表于 2020-1-18 15:43
这一部分有问题。

我明白了谢谢大佬~

账号		自动登录	找回密码
密码			立即注册

[已解决]BS4库.children报错

马上注册，结交更多好友，享用更多功能^_^

浏览过的版块