OOXX可以获取页数但是获取不到图片地址求大神帮看下

JoshuaPY · 发表于 2017-11-22 22:46:12

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

import urllib.request
import os

def url_open(url):
data=None
headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/31.0.1650.63 Safari/537.36'}
req=urllib.request.Request('http://jandan.net/ooxx',data,headers)
response = urllib.request.urlopen(req)
html=response.read()
return html

def get_page(url):
html=url_open(url).decode('utf-8')
a=html.find('current-comment-page')+23
b=html.find(']',a)
return html[a:b]

def find_img(url):

html=url_open(url).decode('utf-8')
img_address=[]
a=html.find('img src=')

while a!=-1:
      b=html.find('.jpg',a,a+255)
      if b!=-1:
         img_address.append(html[a+9:b+4])
      else:
         b=a+9
      a=html.find('img src=',b)
img_new=["http:"+i for i in img_address]
#for each in img_address:
img_address=img_new
return img_address


def save_imgs(img_address):

JoshuaPY · 发表于 2017-11-22 22:46:47

import urllib.request
import os
def url_open(url):
data=None
headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/31.0.1650.63 Safari/537.36'}
req=urllib.request.Request('http://jandan.net/ooxx',data,headers)
response = urllib.request.urlopen(req)
html=response.read()
return html
def get_page(url):
html=url_open(url).decode('utf-8')
a=html.find('current-comment-page')+23
b=html.find(']',a)
return html[a:b]
def find_img(url):
html=url_open(url).decode('utf-8')
img_address=[]
a=html.find('img src=')
while a!=-1:
b=html.find('.jpg',a,a+255)
if b!=-1:
img_address.append(html[a+9:b+4])
else:
b=a+9
a=html.find('img src=',b)
img_new=["http:"+i for i in img_address]
#for each in img_address:
img_address=img_new
return img_address
def save_imgs(img_address):

复制代码

zxszx4 · 发表于 2017-11-23 01:43:35

你把你输出的源代码和爬虫获得的源代码对比一下就会发现不一样！！！为什么呢，我觉得煎蛋为了防止大家爬，把地址改成了js，你要不就真用浏览器，要不就模仿他的js代码试试。

至尊宝___ · 发表于 2017-11-23 14:30:52

我也爬不出图片地址，在shell里打印出网页代码，搜索不到.jpg相关的信息

账号		自动登录	找回密码
密码			立即注册

OOXX可以获取页数 但是获取不到图片地址 求大神帮看下

马上注册，结交更多好友，享用更多功能^_^

浏览过的版块

OOXX可以获取页数但是获取不到图片地址求大神帮看下