鱼C论坛

 找回密码
 立即注册
查看: 4027|回复: 8

小白求助

[复制链接]
发表于 2020-2-14 09:18:34 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
关于爬虫ip地址隐藏的问题
我想访问可以得到自己IP地址的网站,使用代理IP,实现返回代理IP地址,不返回自己真实的IP地址,代码如下:

  1. import requests

  2. url = 'https://ip.cn/'
  3. headers = {'user_agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.87 Safari/537.36'}
  4. proxies ={
  5.         'http,https':'119.119.47.81:8118',
  6.         'http,https':'122.192.38.207:8118',
  7.         'http,https':'113.128.105.103:8118',
  8.         'http':'174.79.119.41:80'
  9.         }
  10. res = requests.get(url,headers=headers,proxies=proxies)
  11. print(res.text)
复制代码

可是总返回真实IP地址,有没有解决办法(换了好几次代理IP了,要么IP无效连接无响应,要么返回真实IP地址)



小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2020-2-14 15:23:47 | 显示全部楼层
在线等回复
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-2-14 16:42:49 | 显示全部楼层
第一, 你的4个代理全是无效的
第二, 你的proxies写法错误
  1. import requests

  2. url = 'https://httpbin.org/ip'
  3. proxies = {
  4.     'https':'http://200.73.128.163:3128'
  5. }
  6. r = requests.get(url, proxies=proxies, timeout=5)
  7. print(r.text)
复制代码
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-2-14 16:48:42 | 显示全部楼层
yjsx86 发表于 2020-2-14 16:42
第一, 你的4个代理全是无效的
第二, 你的proxies写法错误

可是加上timeout = 5报错了
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-2-14 16:49:32 | 显示全部楼层
yjsx86 发表于 2020-2-14 16:42
第一, 你的4个代理全是无效的
第二, 你的proxies写法错误

requests.exceptions.ConnectTimeout: HTTPSConnectionPool(host='httpbin.org', port=443): Max retries exceeded with url: /ip (Caused by ConnectTimeoutError(<urllib3.connection.VerifiedHTTPSConnection object at 0x00000185DFB78FC8>, 'Connection to 200.73.128.163 timed out. (connect timeout=5)'))
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-2-14 16:55:18 | 显示全部楼层
xiangzhihengkan 发表于 2020-2-14 16:49
requests.exceptions.ConnectTimeout: HTTPSConnectionPool(host='httpbin.org', port=443): Max retries ...

把timeout删掉试试呢?
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-2-14 17:36:41 | 显示全部楼层
yjsx86 发表于 2020-2-14 16:55
把timeout删掉试试呢?

还是报错
截取一段:
requests.exceptions.ProxyError: HTTPSConnectionPool(host='httpbin.org', port=443): Max retries exceeded with url: /ip (Caused by ProxyError('Cannot connect to proxy.', NewConnectionError('<urllib3.connection.VerifiedHTTPSConnection object at 0x00000224317EF688>: Failed to establish a new connection: [WinError 10060] 由于连接方在一段时间后没有正确答复或连接的主机没有反应,连接尝试失败。')))
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-2-14 18:09:51 | 显示全部楼层
xiangzhihengkan 发表于 2020-2-14 17:36
还是报错
截取一段:
requests.exceptions.ProxyError: HTTPSConnectionPool(host='httpbin.org', port ...

那就是这个代理ip你那里连不上
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-2-14 20:43:06 | 显示全部楼层
yjsx86 发表于 2020-2-14 18:09
那就是这个代理ip你那里连不上

所以这个隐藏IP还有别的方法吗
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-9-11 06:45

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表