|  | 
 
 发表于 2025-4-3 22:09:11
|
显示全部楼层
   本楼为最佳答案 
| 问题分析:当调用 raise_for_status() 失败时,表示HTTP请求返回了4xx/5xx错误状态码,此时会立即抛出 requests.exceptions.HTTPError 异常,后续代码将不会继续执行
 代码流程说明:
 当网页请求失败时(比如第9行代码),执行流程会这样走:
 
 html = requests.get(...) 会先返回响应对象raise_for_status() 检查响应状态码:
 
 如果是2xx:继续执行后续代码
如果是4xx/5xx:立即抛出异常,程序终止
 
 
 解决方案:
 建议用 try-except 包裹关键代码:
 
 
 复制代码
try:
    html = requests.get(url, headers=headers)
    html.raise_for_status()
    print("网页下载完成")
except requests.exceptions.HTTPError as err:
    print(f"HTTP错误发生: {err}")
    # 这里可以添加重试机制或退出程序
except Exception as err:
    print(f"其他错误: {err}")
 原代码的问题:
 1. 第9行没有错误处理,如果服务器返回404/503等错误会直接崩溃
 2. 第21行图片下载的 raise_for_status() 也存在同样问题
 3. 第13行 finUrl = url + imgUrl 的拼接方式可能错误(建议用 urljoin)
 
 改进建议:
 
 所有网络请求都应包裹在 try-except 中建议使用 session 保持连接图片路径拼接建议改用:
 复制代码
  from urllib.parse import urljoin
  finUrl = urljoin(url, imgUrl)
  
 
 以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。
 | 
 |