[已解决]关于“爬取大学排名”的一些问题

wangyaoxin · 发表于 2019-3-12 10:23:37

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

在B站学习爬虫的时候，我按照视频里讲的那样输入进去代码然而运行时却无结果不知道哪里出了问题，望各位大神指点迷津。。。。
import requests
from bs4 import BeautifulSoup
import bs4

def getHTMLText(url):
try:
      r=requests.get(url,timeout=30)
      r.raise_for_status()
      r.encoding=r.apparent_encoding
      return r.text
except:
      return""

def fillunivlist(ulist,html):
soup=BeautifulSoup(html,"html.parser")
for tr in soup.find('tbody').children:
      if isinstance(tr,bs4.element.Tag):
         tds=tr('td')
         ulist.append([tds[0].string,tds[1].string,tds[3].string])

def fillunivlist(ulist,num):
print("{:^10}\t{:^6}\t{:^10}".format("排名","学校名称","总分"))
for i in range(num):
      u=ulist[i]
      print("{:^10}\t{:^6}\t{:^10}".format(u[0],u[1],u[2]))


def main():
uinfo=[]
url='http://www.zuihaodaxue.com/zuihaodaxuepaiming2019.html'
html=getHTMLText(url)
fillunivlist(uinfo,html)
printunivlist(unifo,20)

最佳答案

月排行榜 / 总排行榜

zlj19931010

2019-3-12 15:27:31

1、函数名称你写错了
2、变量名写错了
3、printunivlist这个函数里的u=ulist[i]我估计你也抄错了

import requests
from bs4 import BeautifulSoup
import bs4
def getHTMLText(url):
try:
r=requests.get(url,timeout=30)
r.raise_for_status()
r.encoding=r.apparent_encoding
return r.text
except:
return ''
def fillunivlist(ulist,html):
soup=BeautifulSoup(html,"html.parser")
for tr in soup.find('tbody').children:
if isinstance(tr,bs4.element.Tag):
tds=tr('td')
ulist.append([tds[0].string,tds[1].string,tds[3].string])
def printunivlist(ulist,num):
print("{:^10}\t{:^6}\t{:^10}".format("排名","学校名称","总分"))
for i in range(num):
u=ulist[i]
print("{:^10}\t{:^6}\t{:^10}".format(u[0],u[1],u[2]))
def main():
uinfo=[]
url='http://www.zuihaodaxue.com/zuihaodaxuepaiming2019.html'
html=getHTMLText(url)
fillunivlist(uinfo,html)
printunivlist(uinfo,20)
if __name__ == '__main__':
main()

复制代码

跳转到最佳答案楼层

幻千城12 · 发表于 2019-3-12 11:40:15

本帖最后由幻千城12 于 2019-3-12 12:00 编辑

两个函数都是一样的名字，主函数也没执行
打印排名前20的学校：

import pandas as pd
data = pd.DataFrame(pd.read_html('http://www.zuihaodaxue.com/zuihaodaxuepaiming2019.html')[0])
data.set_index('排名', inplace=True)
print(data.iloc[:20, :3])

复制代码

wp231957 · 发表于 2019-3-12 14:41:30

# coding: utf-8
import requests
from bs4 import BeautifulSoup
import bs4
def getHTMLText(url):
try:
r=requests.get(url,timeout=30)
r.raise_for_status()
r.encoding=r.apparent_encoding
return r.text
except:
return""
def fillunivlist1(ulist,html):
soup=BeautifulSoup(html,"html.parser")
for tr in soup.find('tbody').children:
if isinstance(tr,bs4.element.Tag):
tds=tr('td')
ulist.append([tds[0].string,tds[1].string,tds[3].string])
def fillunivlist2(ulist,num):
print("{:^10}\t{:^6}\t{:^10}".format("排名","学校名称"," 总分"))
for i in range(num):
u=ulist
print("%8s\t%-18s %5s"%(u[i][0],u[i][1],u[i][2]))
uinfo=[]
url='http://www.zuihaodaxue.com/zuihaodaxuepaiming2019.html'
html=getHTMLText(url)
fillunivlist1(uinfo,html)
fillunivlist2(uinfo,20)

复制代码

能输出了，就是对齐有些问题，你自己再琢磨琢磨

zlj19931010 · 发表于 2019-3-12 15:27:31

这个最佳答案由 zlj19931010 给出，感谢 zlj19931010 的回答。

单击隐藏图章

1、函数名称你写错了
2、变量名写错了
3、printunivlist这个函数里的u=ulist[i]我估计你也抄错了

import requests
from bs4 import BeautifulSoup
import bs4
def getHTMLText(url):
try:
r=requests.get(url,timeout=30)
r.raise_for_status()
r.encoding=r.apparent_encoding
return r.text
except:
return ''
def fillunivlist(ulist,html):
soup=BeautifulSoup(html,"html.parser")
for tr in soup.find('tbody').children:
if isinstance(tr,bs4.element.Tag):
tds=tr('td')
ulist.append([tds[0].string,tds[1].string,tds[3].string])
def printunivlist(ulist,num):
print("{:^10}\t{:^6}\t{:^10}".format("排名","学校名称","总分"))
for i in range(num):
u=ulist[i]
print("{:^10}\t{:^6}\t{:^10}".format(u[0],u[1],u[2]))
def main():
uinfo=[]
url='http://www.zuihaodaxue.com/zuihaodaxuepaiming2019.html'
html=getHTMLText(url)
fillunivlist(uinfo,html)
printunivlist(uinfo,20)
if __name__ == '__main__':
main()

复制代码

wangyaoxin · 发表于 2019-3-12 19:01:09

zlj19931010 发表于 2019-3-12 15:27
1、函数名称你写错了
2、变量名写错了
3、printunivlist这个函数里的u=ulist我估计你也抄错了

老哥你是神仙吧终于运行出来了！！！感谢感谢！！！

账号		自动登录	找回密码
密码			立即注册

[已解决]关于“爬取大学排名”的一些问题

马上注册，结交更多好友，享用更多功能^_^

浏览过的版块