求助各位,刚入门爬虫,写的客户端总是返回400。
本帖最后由 vitamin 于 2020-6-4 14:15 编辑代码如下:
import ssl
import socket
host = "www.douban.com"
port = 443
User_Agent = 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.61 Safari/537.36'
client_sk = ssl.wrap_socket(socket.socket())
client_sk.connect((host,port))
request = 'GET HTTP/1.1\r\nhsot:{} User-Agent:{}\r\n\r\n'.format(host,User_Agent).encode('utf8')
client_sk.send(request)
response = client_sk.recv(1024).decode('utf8')
print(response)
结果如下:
HTTP/1.1 400 Bad Request
Date: Thu, 04 Jun 2020 05:19:43 GMT
Content-Type: text/html
Content-Length: 150
Connection: close
Server: dae
<html>
<head><title>400 Bad Request</title></head>
<body>
<center><h1>400 Bad Request</h1></center>
<hr><center>nginx</center>
</body>
</html>
{:5_111:}求解求解。。。。 发个完整代码呗 Twilight6 发表于 2020-6-4 13:24
发个完整代码呗
就是一个简单的客户端
前面几句,导入socket,ssl 就没了啊{:5_100:} vitamin 发表于 2020-6-4 13:33
就是一个简单的客户端
前面几句,导入socket,ssl 就没了啊
这是让大伙猜 wp231957 发表于 2020-6-4 13:59
这是让大伙猜
{:5_92:} vitamin 发表于 2020-6-4 14:15
我贴全了。。就是一个发请求的客户端,不明原因的连不上host,我ping的通host {:5_107:}求助。。。。 vitamin 发表于 2020-6-4 14:16
我贴全了。。就是一个发请求的客户端,不明原因的连不上host,我ping的通host
不建议你写原生态的请求,这就相当于你有现成的轮子不用,自己重新制作一个
为了学习,到不是不可以,就是需要的只是储备比较多啊 禁止访问,哈哈哈 wp231957 发表于 2020-6-4 15:53
不建议你写原生态的请求,这就相当于你有现成的轮子不用,自己重新制作一个
为了学习,到不是不可以,就 ...
{:5_92:} 就是想知道轮子咋做的。。。问题是我搞不懂这是怎么回事啊,为什么总是bad request呢 jia159753 发表于 2020-6-4 20:53
禁止访问,哈哈哈
{:5_100:}为什么为什么。。。。
页:
[1]