[已解决]Python爬虫发送请求和返回结果问题？

zyj1214 · 发表于 2023-10-28 19:41:26

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

# (1)定义一个url 就是你要访问的地址
url = 'http://www.baidu.com'

response = urllib.request.urlopen(url)

print(response)

#打印结果
#<http.client.HTTPResponse object at 0x00000244198D6D60>
#这里面是什么，
#这个结果http.client.HTTPResponse object at是什么？
#0x00000244198D6D60> 是什么？

最佳答案

月排行榜 / 总排行榜

陶远航

2023-10-28 19:42:10

在Python中，当你使用urllib.request.urlopen(url)发送一个请求到指定的URL时，它会返回一个HTTPResponse对象。这个对象包含了服务器对你请求的响应。

<http.client.HTTPResponse object at 0x00000244198D6D60>是Python解释器对这个HTTPResponse对象的描述。

· http.client.HTTPResponse是对象的类型，表示这是一个HTTPResponse对象，它来自于http.client模块。

· object at 0x00000244198D6D60表示这个对象在内存中的地址。0x00000244198D6D60是这个对象在你的计算机内存中的位置，这个地址是由Python解释器分配的，每次运行程序时可能会有所不同。

如果你想要查看这个HTTPResponse对象的内容，你可以使用read()方法读取它，例如：

response = urllib.request.urlopen(url)
content = response.read()
print(content)

复制代码

这将会打印出从URL获取的内容，通常是HTML代码。如果你想要以更易读的方式查看HTML，你可能需要使用decode()方法将其从字节码转换为字符串，例如：

response = urllib.request.urlopen(url)
content = response.read().decode('utf-8')
print(content)

复制代码

这将会打印出更易读的HTML代码。
请注意，本回答来自GPT-4
如果问题已经解决，请设置最佳答案

跳转到最佳答案楼层

isdkz · 发表于 2023-10-28 19:41:37

这个结果 http.client.HTTPResponse object at 0x00000244198D6D60> 是一个对象的表示形式。它表示 http.client.HTTPResponse 类的一个实例，该实例代表了从服务器返回的HTTP响应。

在Python中，当你打印一个对象时，它会调用该对象的 __str__ 方法来返回一个可读性较好的字符串表示形式。对于 http.client.HTTPResponse 对象，它的 __str__ 方法返回了对象的类名和在内存中的地址。

如果你想要获取响应的内容，你可以使用 response.read() 方法来获取响应的主体内容。例如：

url = 'http://www.baidu.com'

response = urllib.request.urlopen(url)

content = response.read()

print(content)

复制代码

这样，你将会打印出从百度网站返回的HTML内容。

陶远航 · 发表于 2023-10-28 19:42:10

在Python中，当你使用urllib.request.urlopen(url)发送一个请求到指定的URL时，它会返回一个HTTPResponse对象。这个对象包含了服务器对你请求的响应。

<http.client.HTTPResponse object at 0x00000244198D6D60>是Python解释器对这个HTTPResponse对象的描述。

· http.client.HTTPResponse是对象的类型，表示这是一个HTTPResponse对象，它来自于http.client模块。

· object at 0x00000244198D6D60表示这个对象在内存中的地址。0x00000244198D6D60是这个对象在你的计算机内存中的位置，这个地址是由Python解释器分配的，每次运行程序时可能会有所不同。

如果你想要查看这个HTTPResponse对象的内容，你可以使用read()方法读取它，例如：

response = urllib.request.urlopen(url)
content = response.read()
print(content)

复制代码

这将会打印出从URL获取的内容，通常是HTML代码。如果你想要以更易读的方式查看HTML，你可能需要使用decode()方法将其从字节码转换为字符串，例如：

response = urllib.request.urlopen(url)
content = response.read().decode('utf-8')
print(content)

复制代码

这将会打印出更易读的HTML代码。
请注意，本回答来自GPT-4
如果问题已经解决，请设置最佳答案

zyj1214 · 发表于 2023-10-28 19:49:34

陶远航发表于 2023-10-28 19:42
在Python中，当你使用urllib.request.urlopen(url)发送一个请求到指定的URL时，它会返回一个HTTPResponse对 ...

HTTPResponse对象的地址里面放的是二进制的数据吗?

陶远航 · 发表于 2023-10-28 19:56:51

zyj1214 发表于 2023-10-28 19:49
HTTPResponse对象的地址里面放的是二进制的数据吗?

不完全是。HTTPResponse对象的地址并不直接存储二进制数据。这个地址实际上是Python内存中的一个位置，这个位置存储的是HTTPResponse对象的信息。

HTTPResponse对象包含了很多属性和方法，这些属性和方法可以用来获取和处理HTTP响应。其中，read()方法可以用来获取响应体的二进制内容。这个二进制内容通常是HTML、JSON或其他格式的数据，这取决于你请求的URL和服务器的响应。

所以，当你看到类似<http.client.HTTPResponse object at 0x00000244198D6D60>的输出时，这个地址（0x00000244198D6D60）是HTTPResponse对象在内存中的位置，而不是二进制数据的存储位置。你可以通过调用HTTPResponse对象的方法（如read()）来获取存储在服务器上的二进制数据。

账号		自动登录	找回密码
密码			立即注册

[已解决]Python爬虫发送请求和返回结果问题？

马上注册，结交更多好友，享用更多功能^_^

本帖被以下淘专辑推荐:

浏览过的版块