一斤c 发表于 2020-4-21 20:51:54

爬虫使用beautifulsoup出现soup没有被定义问题

import requests
import bs4

res = requests.get("https://search.bilibili.com/all?keyword=%E7%BC%96%E7%A8%8B&amp%3Bfrom_source=nav_search&amp%3Bspm_id_from=333.851.b_696e7465726e6174696f6e616c486561646572.9")
res.text
bs4.BeautifulSoup(res.text, "html.parser")
titles = soup.find_all("li", class_="video-item matrix")
for each in titles:
    print(each.a['title'])


刚接触爬虫,希望各位指点迷津

一斤c 发表于 2020-4-21 20:55:10

已安装bs4的库

BngThea 发表于 2020-4-21 20:55:47

第6行,将生成的对象赋值给soup

liuzhengyuan 发表于 2020-4-21 20:56:04

一斤c 发表于 2020-4-21 20:55
已安装bs4的库

如何正确地发代码、上传图片和附件?
https://fishc.com.cn/thread-52272-1-1.html
(出处: 鱼C论坛)

一斤c 发表于 2020-4-21 20:59:20

BngThea 发表于 2020-4-21 20:55
第6行,将生成的对象赋值给soup

非常感谢您的回复,我已经更改了,运行正常,但是没有print出title,不知是何原因

一斤c 发表于 2020-4-21 21:00:00

liuzhengyuan 发表于 2020-4-21 20:56
如何正确地发代码、上传图片和附件?
https://fishc.com.cn/thread-52272-1-1.html
(出处: 鱼C论坛)

感谢指正

liuzhengyuan 发表于 2020-4-21 21:00:44

一斤c 发表于 2020-4-21 20:59
非常感谢您的回复,我已经更改了,运行正常,但是没有print出title,不知是何原因

有可能是 网页反爬虫 或 路径错误

一斤c 发表于 2020-4-21 21:03:05

liuzhengyuan 发表于 2020-4-21 21:00
有可能是 网页反爬虫 或 路径错误

明白了,如果不是代码逻辑的错误那我就去网站找原因,谢谢

liuzhengyuan 发表于 2020-4-21 21:03:48

一斤c 发表于 2020-4-21 21:03
明白了,如果不是代码逻辑的错误那我就去网站找原因,谢谢

换换别的网站试试,(鱼C论坛 可以无故障的作为爬虫对象)

一斤c 发表于 2020-4-21 21:04:18

liuzhengyuan 发表于 2020-4-21 21:03
换换别的网站试试,(鱼C论坛 可以无故障的作为爬虫对象)

收到!
页: [1]
查看完整版本: 爬虫使用beautifulsoup出现soup没有被定义问题