爬虫最基础的东西遇到了问题，大佬,Python交流,编程语言专区,鱼C论坛

大地郡主 发表于 2020-7-21 11:19:13

爬虫最基础的东西遇到了问题，大佬

求助！
请问我在pycharm中写了小甲鱼书上的这段代码
import requests

res = requests.get("https://movie.douban.com/top250")
print(res.text)

可是pycharm什么都没有打印出来

print(res.text)
********************************
*******************************
‘*’代表空格，意思是什么都没打
请问这是怎么回事呢

Twilight6 发表于 2020-7-21 11:21:41

被反爬了呗，加个 headers 即可：

import requests

headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'}

res = requests.get("https://movie.douban.com/top250",headers=headers)
print(res.text)

xiaosi4081 发表于 2020-7-21 11:23:27

本帖最后由 xiaosi4081 于 2020-7-21 11:26 编辑

不加个ua，肯定爬不到啦：
import requests
headers = {"User-Agent":" Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.122 Safari/537.36"}

res = requests.get("https://movie.douban.com/top250",headers=headers)
print(res.text)

headers 就是请求头，如果不加请求头的话，可能没法通过服务器的检查

如果帮助到你了，记得设置最佳哈{:10_287:}

xiaosi4081 发表于 2020-7-21 11:24:11

Twilight6 发表于 2020-7-21 11:21
被反爬了呗，加个 headers 即可：

可恶，被你抢了{:10_266:}

大地郡主 发表于 2020-7-21 11:39:18

Twilight6 发表于 2020-7-21 11:21
被反爬了呗，加个 headers 即可：

谢谢您，请问您当时学爬虫时是怎样学的，我现在在书上看到的所有案例现在打出来好像都不太行{:10_247:}
请您指点一下

大地郡主 发表于 2020-7-21 11:40:03

xiaosi4081 发表于 2020-7-21 11:23
不加个ua，肯定爬不到啦：

谢谢您！

页: [1]

鱼C论坛's Archiver

爬虫最基础的东西遇到了问题，大佬