代理服务器是使用问题
有如下一段代码:(由于没有发送带url权限的帖子, 下面的网址用空格分开了)import urllib.request
url = 'http:// www .whatism yip .com.tw'
proxy_support = urllib.request.ProxyHandler({'http':'39.102.211.64'})
#创建一个包含代理IP的opener
opener = urllib.request.build_opener(proxy_support)
#安装进默认环境
urllib.request.install_opener(opener)
#看ip地址是否改变
resp = urllib.request.urlopen(url)
html = resp.read().decode('utf-8')
print(html)
程序执行以后, 显示如下的返回值:
<html><head><title>Notes</title></head><body></body></html>
发现其中的各个相并没有展开, 这个要怎么弄啊? 谢谢 根据您描述的情况,使用代理服务器访问网址时返回的内容可能不如预期展开,这可能有以下原因:
1. **代理设置问题**:确保代理IP和端口号正确,并且该代理是可用的。可以通过一些在线服务检查代理是否可用。
2. **目标网址问题**:所访问的网站可能会阻止某些代理访问,或者对某些请求进行了限制。
3. **HTTP与HTTPS问题**:确认网址的协议和代理的协议匹配。如果网址是HTTPS,请在代理设置中使用`https`而不是`http`。
4. **编码问题**:确保抓取的网页内容编码正确,有时网页可能使用不同的编码,这会影响内容的显示。
以下是一个检查和调整的步骤:
import urllib.request
# 检查代理是否可用
proxy_handler = urllib.request.ProxyHandler({'http': 'http://39.102.211.64:8080', 'https': 'http://39.102.211.64:8080'})
opener = urllib.request.build_opener(proxy_handler)
# 安装opener
urllib.request.install_opener(opener)
# 访问网址
url = 'http://www.whatismyip.com.tw'
try:
resp = urllib.request.urlopen(url, timeout=10)
html = resp.read().decode('utf-8')
print(html)
except Exception as e:
print(f"An error occurred: {e}")
注意:
- 要确保代理服务器IP后包括端口号,例如`'39.102.211.64:8080'`。
- 如果仍旧不能访问,可能和目标网站屏蔽了代理有关,可以尝试使用其他代理IP。
以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。
页:
[1]