鱼C论坛

 找回密码
 立即注册
查看: 2171|回复: 4

代理ip怎么辨别能不能用

[复制链接]
发表于 2020-8-15 20:33:59 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
import urllib.request

#这一段三句话是为了请求时带上浏览器标识,因为有的网站看到是爬虫的标识直接返回403
#请求的网站不涉及到提交数据,所以没有给出data参数
url = 'https://baidu.com/'
header = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36',
        'Accept':'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
        'Accept-Language':'en-US,en;q=0.5',
        'Accept-Encoding':'gzip',
        'DNT':'1',
        'Connection':'close'}
req = urllib.request.Request(url,headers=header)

#使用代理和还原不使用代理的方法
#if语句相当于一个开关,不要写成True
use_proxy = urllib.request.ProxyHandler({'https':'59.38.222.104'})

opener = urllib.request.build_opener(use_proxy)#默认使用本地ip
urllib.request.install_opener(opener)

#获取返回结果
#同时可以使用html = opener.open(req).read()获取结果
html = urllib.request.urlopen(req).read()
print(html)
为什么我找了好多代理ip试了,都不行,我都开始怀疑是我程序有问题了。
大佬们看看程序有没有问题?然后再推荐推荐几个代理ip网址呗
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-8-15 21:12:13 | 显示全部楼层
proxies = {
  "http": "49.70.122.136:4216"
}
这个代理可用,实测
https://proxy.seofangfa.com/
从这个网站找的
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-8-15 21:21:29 | 显示全部楼层


你的 IP 忘记加上端口了,IP 可以去下面找找看

高匿免费 IP --> https://ip.jiangxianli.com/?page=1&country=%E4%B8%AD%E5%9B%BD

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-8-15 21:23:28 | 显示全部楼层
免费的代理IP 能用的没几个 收费的一天都要8块  当初我做IP代理池 爬了1W多个 能用的也就几十个

你可以爬取那些免费的代理IP 比如西刺代理 写个爬虫爬IP 然后保存到redis数据库里 然后在一个代理IP一个代理IP的试 这个看你会不会设计代理池了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-8-15 22:52:36 | 显示全部楼层
admintest166 发表于 2020-8-15 21:23
免费的代理IP 能用的没几个 收费的一天都要8块  当初我做IP代理池 爬了1W多个 能用的也就几十个  ...

这么现实的吗……看来我的代理梦想破灭了……
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-12-25 01:11

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表