谁能告诉我,这是发生了什么?
本帖最后由 NZND 于 2020-4-4 15:16 编辑我自己明明跟着小甲鱼老湿抄的代码,但是在我这运行就一直提示HTTPError:403:Forbidden,这是为什么?(我在听的是OOXX章节)
附上代码一份:
import urllib.request
import os
def openurl(url):
req = urllib.request.Request(url)
req.add_header('User-Agent','Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.102 Safari/537.36 Edge/18.18363')
response = urllib.request.urlopen(url)
html = response.read()
def get_page(url):
html = openurl(url).decode('utf-8')
a = html.find('current-comment-page') + 23
b = html.find("]",a)
return html
def find_imgs(url):
html = openurl(url).decode('utf-8')
img_addrs = []
a = html.find('img src=')
while a != -1:
b = html.find(".jpg",a,a+255)
if b != -1:
image_addrs.append(html)
else:
b = a + 9
a = html.find('img src=',b)
def save_imgs(floder,img_addrs):
pass
def download_mm(floder = 'OOXX',pages = 10):
try:
os.mkdir(floder)
os.chdir(floder)
except:
os.chdir(floder)
url = "http://jandan.net/ooxx/"
page_num = int(get_page(url))
for i in range(pages):
pages_num -= i
page_url = url + 'page-' + str(page_num) + '#comments'
img_addrs = find_imgs(page_url)
save_imgs(floder,img_addrs)
if __name__ == '__main__':
download_mm()
谁能告诉我,这是为什么?{:5_100:} 403明显是反爬呢 现在网站都反爬虫了 你访问的网站反爬了
这个亲测可行 小甲鱼这篇[https://fishc.com.cn/thread-103840-1-1.html] 那为什么python官网就不会被反爬? NZND 发表于 2020-4-4 16:37
那为什么python官网就不会被反爬?
都是自家人[滑稽] NZND 发表于 2020-4-4 16:37
那为什么python官网就不会被反爬?
官网没设置呗
而且,请回复(帖子下方的回复按钮)别人,不然别人看不见 现在的网站那个没反爬 谢谢! 反爬吧 NZND 发表于 2020-4-4 17:53
谢谢!
画风越来越不正常了 _2_ 发表于 2020-4-4 18:14
画风越来越不正常了
你换头像了???!!! 乘号 发表于 2020-4-4 21:56
你换头像了???!!!
对呀 _2_ 发表于 2020-4-4 21:57
对呀
真特么真实………… 乘号 发表于 2020-4-4 21:57
真特么真实…………
所以嘛…… _2_ 发表于 2020-4-4 21:58
所以嘛……
{:10_250:} 老八秘制 发表于 2020-4-4 16:41
都是自家人[滑稽]
{:10_250:}
页:
[1]