requests问题
本帖最后由 匿名 于 2023-5-28 13:27 编辑import requests
def get_raw():
url = "https://movie.douban.com"
content = requests.get(url)
return content
print(get_raw())
为什么输出是:
E:\Python123\venv\Scripts\python.exe E:\Python123\a\main.py
<Response >
进程已结束,退出代码0
418???我用selenium就没出过这个问题 匿名者 发表于 2023-5-28 13:37
是的,还是跟原来一样,爬不到
设置ua呢?
import requests
def get_raw():
url = "https://movie.douban.com"
content = requests.get(url, headers={'User-Agent':'Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Trident/5.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; Media Center PC 6.0; InfoPath.2; .NET CLR 1.1.4322; .NET4.0C; Tablet PC 2.0)'})
return content.text
print(get_raw()) 匿名者 发表于 2023-5-28 13:43
可以了,不过这是啥浏览器
有一个库叫 fake_useragent,可以随机生成UA,我都不知道这是啥浏览器{:10_277:}
你用这个
'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.106 Safari/537.36 Edg/80.0.361.54' requests不会,帮你叫人@歌者文明清理员 @isdkz @sfqxx yinda_peng 发表于 2023-5-28 13:32
requests不会,帮你叫人@歌者文明清理员 @isdkz @sfqxx
求助者就是我{:10_277:} 歌者文明清理员 发表于 2023-5-28 13:33
求助者就是我
az yinda_peng 发表于 2023-5-28 13:33
az
需要证明吗{:10_277:} 歌者文明清理员 发表于 2023-5-28 13:34
需要证明吗
不,只是我没有想到 import requests
def get_raw():
url = "https://movie.douban.com"
content = requests.get(url)
return content.text
print(get_raw()) liuhongrun2022 发表于 2023-5-28 13:35
还是一样 匿名者 发表于 2023-5-28 13:36
还是一样
我的这个是不是没有输出? liuhongrun2022 发表于 2023-5-28 13:36
我的这个是不是没有输出?
是的,还是跟原来一样,爬不到 liuhongrun2022 发表于 2023-5-28 13:42
设置ua呢?
可以了,不过这是啥浏览器{:10_277:}
页:
[1]