鱼C论坛

 找回密码
 立即注册
查看: 2615|回复: 1

pyhton爬取代理IP的问题

[复制链接]
发表于 2017-4-27 14:20:22 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
  1. import re
  2. import os
  3. import urllib.request
  4. from urllib.error import HTTPError, URLError


  5. def open_url(url):
  6.     req = urllib.request.Request(url)
  7.     req.add_header('User-Agent', 'Mozilla/5.0 (Windows NT 6.1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36')
  8.     try:
  9.         response = urllib.request.urlopen(req)
  10.     except (HTTPError, URLError) as e:
  11.         print(e)
  12.     try:
  13.         html = response.read().decode('utf-8')
  14.     except UnboundLocalError as e:
  15.         print(e)

  16.     return html

  17. def save_file(html):
  18.     p = r'(?:(?:[0-1]?\d?\d|2[0-4]\d|25[0-5])\.){3}(?:[0-1]?\d?\d|2[0-4]\d|25[0-5])'
  19.     ip_list = re.findall(p, html)
  20.     for each in ip_list:
  21.        print(eachh)
  22. if __name__ == "__main__":
  23.     url = "https://cn.proxy.com"
  24.     save_file(open_url(url))
复制代码


这几个异常如何解决?
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2017-4-27 14:50:00 | 显示全部楼层
研究了一下,原来是url失效了,自己太粗心了
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-7-15 06:20

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表