vitamin 发表于 2020-6-4 13:21:08

求助各位,刚入门爬虫,写的客户端总是返回400。

本帖最后由 vitamin 于 2020-6-4 14:15 编辑

代码如下:
import ssl
import socket

host = "www.douban.com"
port = 443
User_Agent = 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.61 Safari/537.36'
client_sk = ssl.wrap_socket(socket.socket())

client_sk.connect((host,port))

request = 'GET HTTP/1.1\r\nhsot:{} User-Agent:{}\r\n\r\n'.format(host,User_Agent).encode('utf8')

client_sk.send(request)

response = client_sk.recv(1024).decode('utf8')
print(response)

结果如下:
HTTP/1.1 400 Bad Request
Date: Thu, 04 Jun 2020 05:19:43 GMT
Content-Type: text/html
Content-Length: 150
Connection: close
Server: dae

<html>
<head><title>400 Bad Request</title></head>
<body>
<center><h1>400 Bad Request</h1></center>
<hr><center>nginx</center>
</body>
</html>
{:5_111:}求解求解。。。。

Twilight6 发表于 2020-6-4 13:24:18

发个完整代码呗

vitamin 发表于 2020-6-4 13:33:53

Twilight6 发表于 2020-6-4 13:24
发个完整代码呗

就是一个简单的客户端
前面几句,导入socket,ssl 就没了啊{:5_100:}

wp231957 发表于 2020-6-4 13:59:30

vitamin 发表于 2020-6-4 13:33
就是一个简单的客户端
前面几句,导入socket,ssl 就没了啊

这是让大伙猜

vitamin 发表于 2020-6-4 14:15:06

wp231957 发表于 2020-6-4 13:59
这是让大伙猜

{:5_92:}

vitamin 发表于 2020-6-4 14:16:24

vitamin 发表于 2020-6-4 14:15


我贴全了。。就是一个发请求的客户端,不明原因的连不上host,我ping的通host

vitamin 发表于 2020-6-4 15:34:16

{:5_107:}求助。。。。

wp231957 发表于 2020-6-4 15:53:06

vitamin 发表于 2020-6-4 14:16
我贴全了。。就是一个发请求的客户端,不明原因的连不上host,我ping的通host

不建议你写原生态的请求,这就相当于你有现成的轮子不用,自己重新制作一个
为了学习,到不是不可以,就是需要的只是储备比较多啊

jia159753 发表于 2020-6-4 20:53:27

禁止访问,哈哈哈

vitamin 发表于 2020-6-5 13:32:54

wp231957 发表于 2020-6-4 15:53
不建议你写原生态的请求,这就相当于你有现成的轮子不用,自己重新制作一个
为了学习,到不是不可以,就 ...

{:5_92:} 就是想知道轮子咋做的。。。问题是我搞不懂这是怎么回事啊,为什么总是bad request呢

vitamin 发表于 2020-6-5 13:33:36

jia159753 发表于 2020-6-4 20:53
禁止访问,哈哈哈

{:5_100:}为什么为什么。。。。
页: [1]
查看完整版本: 求助各位,刚入门爬虫,写的客户端总是返回400。