鱼C论坛

 找回密码
 立即注册
查看: 1838|回复: 13

Python爬虫实例

[复制链接]
发表于 2023-10-4 13:33:44 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
看不太懂红字提醒,请问到底是哪里不对嘞?
微信图片_20231004133156.png
微信图片_20231004133220.png

本帖被以下淘专辑推荐:

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2023-10-4 13:34:24 | 显示全部楼层
您好!关于您提到的红字提醒,您没有提供足够的信息,所以我无法确定具体问题。但是,我可以为您提供一个简单的 Python 爬虫实例,您可以参考这个实例来检查您的代码是否有问题。

以下是一个使用 requestsBeautifulSoup 库的简单 Python 爬虫示例,用于抓取一个网页上的标题:
import requests
from bs4 import BeautifulSoup

def get_page_title(url):
    response = requests.get(url)
    if response.status_code == 200:
        soup = BeautifulSoup(response.text, 'html.parser')
        title = soup.find('title')
        return title.text
    else:
        return None

if __name__ == "__main__":
    url = "https://www.example.com"
    title = get_page_title(url)
    if title:
        print(f"页面标题:{title}")
    else:
        print("无法获取页面标题")

在运行此代码之前,请确保您已经安装了 requestsBeautifulSoup 库。您可以使用以下命令安装这两个库:
pip install requests
pip install beautifulsoup4

如果您在运行代码时遇到问题,请提供更多详细信息,以便我能更好地帮助您解决问题。
如果问题已经解决,请设置最佳答案
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2023-10-4 13:38:10 | 显示全部楼层
育碧
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2023-10-4 13:38:20 | 显示全部楼层

回帖奖励 +10 鱼币

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2023-10-4 13:39:45 | 显示全部楼层
育碧谢谢
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2023-10-4 13:40:28 | 显示全部楼层
啊?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2023-10-4 13:42:43 | 显示全部楼层
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2023-10-4 13:47:09 | 显示全部楼层
什么运气啊欧文
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2023-10-4 13:49:13 | 显示全部楼层
哥,你这是50%的概率吗?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2023-10-4 13:50:26 | 显示全部楼层

回帖奖励 +10 鱼币

我也没领过啊
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2023-10-4 14:12:31 | 显示全部楼层

回帖奖励 +10 鱼币

我也没领过啊

厉害!
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2023-10-4 16:20:01 | 显示全部楼层
应该是字符格式化出问题了,请先尝试打印格式化的字符,就是打印format里面的内容,确定类型以及是否支持格式化
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 0 反对 1

使用道具 举报

发表于 2023-10-4 17:47:44 | 显示全部楼层
你拿到的 u[0] u[1] u[2] 中至少有一个是 None ,你可以执行以下代码复现问题:
print("{0:<10}".format(None))
你可以尝试一下在 print 之前检测一下 None in u[0:3] ,
或者将 u[0] 到 u[2] 都 str() 一下。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2023-10-4 18:51:11 | 显示全部楼层
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-11-14 14:38

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表