鬼少 发表于 2024-11-17 22:23:55

代理服务器是使用问题

有如下一段代码:(由于没有发送带url权限的帖子, 下面的网址用空格分开了)
import urllib.request

url = 'http:// www .whatism yip .com.tw'

proxy_support = urllib.request.ProxyHandler({'http':'39.102.211.64'})
#创建一个包含代理IP的opener
opener = urllib.request.build_opener(proxy_support)
#安装进默认环境
urllib.request.install_opener(opener)
#看ip地址是否改变

resp = urllib.request.urlopen(url)
html = resp.read().decode('utf-8')
print(html)

程序执行以后, 显示如下的返回值:
<html><head><title>Notes</title></head><body></body></html>

发现其中的各个相并没有展开, 这个要怎么弄啊? 谢谢

FishC 发表于 2024-11-17 22:24:04

根据您描述的情况,使用代理服务器访问网址时返回的内容可能不如预期展开,这可能有以下原因:

1. **代理设置问题**:确保代理IP和端口号正确,并且该代理是可用的。可以通过一些在线服务检查代理是否可用。

2. **目标网址问题**:所访问的网站可能会阻止某些代理访问,或者对某些请求进行了限制。

3. **HTTP与HTTPS问题**:确认网址的协议和代理的协议匹配。如果网址是HTTPS,请在代理设置中使用`https`而不是`http`。

4. **编码问题**:确保抓取的网页内容编码正确,有时网页可能使用不同的编码,这会影响内容的显示。

以下是一个检查和调整的步骤:

import urllib.request

# 检查代理是否可用
proxy_handler = urllib.request.ProxyHandler({'http': 'http://39.102.211.64:8080', 'https': 'http://39.102.211.64:8080'})
opener = urllib.request.build_opener(proxy_handler)

# 安装opener
urllib.request.install_opener(opener)

# 访问网址
url = 'http://www.whatismyip.com.tw'
try:
    resp = urllib.request.urlopen(url, timeout=10)
    html = resp.read().decode('utf-8')
    print(html)
except Exception as e:
    print(f"An error occurred: {e}")

注意:
- 要确保代理服务器IP后包括端口号,例如`'39.102.211.64:8080'`。
- 如果仍旧不能访问,可能和目标网站屏蔽了代理有关,可以尝试使用其他代理IP。

以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。
页: [1]
查看完整版本: 代理服务器是使用问题