鱼C论坛

 找回密码
 立即注册
查看: 1930|回复: 1

[已解决]爬虫

[复制链接]
发表于 2021-10-29 21:38:41 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
有没有大哥知道下面的代码出了什么问题

import requests
import bs4

url = 'https://psychology.ku.dk/staff/academic_staff/'

headers = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/95.0.4638.54 Safari/537.36'}

response = requests.get(url, headers=headers)

soup = bs4.BeautifulSoup(response.text, 'html.parser')

name_targets = soup.find_all('td', class_=('emplistname', 'sorting_1'))
names=[]
for each in name_targets:
    name = each.a.text
    names.append(name)

title_targets = soup.find_all('td', class_="emplisttitle")
titles = []
for each in title_targets:
    title = each.text
    titles.append(title)
   
area_targets = soup.find_all('td', class_="emplistworkarea")
areas = []
for each in area_targets:
    area = each.text
    areas.append(area)
   
mail_targets = soup.find_all('td', class_="emplistemail")
mails = []
for each in mail_targets:
    mail = each.a['title']
    mails.append(mail)


KeyError                                  Traceback (most recent call last)
~\AppData\Local\Temp/ipykernel_76524/2616645663.py in <module>
     31 mails = []
     32 for each in mail_targets:
---> 33     mail = each.a['title']
     34     mails.append(mail)

C:\ProgramData\Anaconda3\lib\site-packages\bs4\element.py in __getitem__(self, key)
   1484         """tag[key] returns the value of the 'key' attribute for the Tag,
   1485         and throws an exception if it's not there."""
-> 1486         return self.attrs[key]
   1487
   1488     def __iter__(self):

KeyError: 'title'
最佳答案
2021-10-30 09:03:32
a标签没有title这个属性
  1. <a href="#" onclick="this.href=&#39;mai&#39; + &#39;lto:&#39; + &#39;ann-louise.holten&#39;+&#39;@&#39;+&#39;psy.ku&#39;+&#39;.&#39;+&#39;dk&#39;;return true;" onmouseover="this.[title=&#39;ann-louise.holten&#39;+&#39;@&#39;+&#39;psy.ku&#39;+&#39;.&#39;+&#39;dk&#39;; return true;">E-mail</a>
复制代码

title很明显是onmouseover属性的值
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2021-10-30 09:03:32 | 显示全部楼层    本楼为最佳答案   
a标签没有title这个属性
  1. <a href="#" onclick="this.href=&#39;mai&#39; + &#39;lto:&#39; + &#39;ann-louise.holten&#39;+&#39;@&#39;+&#39;psy.ku&#39;+&#39;.&#39;+&#39;dk&#39;;return true;" onmouseover="this.[title=&#39;ann-louise.holten&#39;+&#39;@&#39;+&#39;psy.ku&#39;+&#39;.&#39;+&#39;dk&#39;; return true;">E-mail</a>
复制代码

title很明显是onmouseover属性的值
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-10-24 08:27

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表