|
|
5鱼币
- import urllib.request
- import os
- def get_page(url):
- req=urllib.request.Request(url)
- req.add_header('User-Agent','Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36')
- response=urllib.request.urlopen(url)
- html=response.read().decode('utf-8')
-
- a=html.find('current-comment-page')+23
- b=html.find(']',a)
- print(html[a:b])
- def find_images(url):
- pass
- def save_images(folder,img_addrs):
- pass
- def downloadmm(folder="lovemm",pages=10):
- os.mkdir(folder)
- os.chdir(folder)
- url="http://jandan.net/ooxx"
-
- page_num=int(get_page(url))
- for i in range(pages):
- page_num-= i
- page_url=url+'page-'+ str(page_num)+"#comments"
- img_addrs= find_images(page_url)
- save_images(folder,img_addrs)
- if _name_=='_main_':
- downloadmm()
-
复制代码
请问 第56个视频 我在前面部分到了12分15秒位置,运行了一次就显示
NameError: name 'url' is not defined
>>>
我可是全部按照视频里的操作来的呀,自己怎么都比较不出来,请求兄弟姐妹们给个提示,谢谢
好多缩进的错误。。。
7-15行都没有缩进,36,37也没缩进
还有我看到一个帖子说煎蛋网已经禁止爬虫了
你试试这个 
"http://www.chunmm.com"
(只能试试哦。。。)
|
最佳答案
查看完整内容
好多缩进的错误。。。
7-15行都没有缩进,36,37也没缩进
还有我看到一个帖子说煎蛋网已经禁止爬虫了
你试试这个
"http://www.chunmm.com"
(只能试试哦。。。)
|