056课中问题求解

snakeshe · 发表于 2017-5-9 07:41:47

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

视频看到一半有点疑惑的地方

import urllib.request ##browse the homepage
import os
def get_page(url):
req = urllib.request.Request(url)
req.add_header('User-Agent' , 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.106 Safari/537.36')
response = urllib.request.urlopen(url)
html = response.read().decode('utf-8')
a = html.find('current-comment-page') + 23
b =
def find_img(url):
pass
def save_imgs(img_addrs):
pass
def download_mm(folder = 'OOXX' , pages = 10):
os.mkdir(folder)
os.chdir(folder)
url = 'http://jandan.net/ooxx'
page_num = int(get_page(url)) ##/why?
for i in range(pages):
page_num -= i
page_url = url + '/page-' + str(page_num) + '#comments'
img_addrs = find_imgs(page_url)
save_imgs(folder , img_addrs)
if __name__ == '__main__':
download_mm()

复制代码

1.page_num = int(get_page(url)) ##/why?
2.a = html.find('current-comment-page') + 23 这连个地方？

Aifrincoo · 发表于 2017-5-9 08:56:05

1.page_num = int(get_page(url))这里get_page(url)出来的是一个str格式的数字，你要把它转换成int格式，然后每次数字（页数）+1或者-1这个数学运算就可以行得通了。
2.a = html.find('current-comment-page') + 23这里html.find('current-comment-page')返回的是字符串首个字符（current中c）的位置，之后+23则是往右偏移23个字符（页数的第一个字符）。

账号		自动登录	找回密码
密码			立即注册

056课中问题求解

马上注册，结交更多好友，享用更多功能^_^

浏览过的版块