鱼C论坛

 找回密码
 立即注册
查看: 995|回复: 16

怎么打印不出来,哪里错了

[复制链接]
发表于 2019-4-19 22:06:10 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
  1. import requests
  2. from lxml import etree



  3. class Dynamic(object):
  4.     def __init__(self):
  5.         self.url = "https://www.soogif.com"
  6.         self.headers={"User-Agent:Mozilla/5.0 (Windows NT 5.1)AppleWebKit/537.36(KHTML, like Gecko) Chrome/56.0.2924.90 Safari/537.36 2345Explorer/9.7.0.18838"}


  7.     #1. 发送请求获取响应
  8.     def send_request(self, url):
  9.         response = requests.get(url, headers=self.headers)
  10.         return response.content

  11.     #2. 数据筛选
  12.     def data_cleansing(self,data, rel):
  13.         element = etree.HTML(data)
  14.         html_xpath = element.xpath(rel)
  15.         return html_xpath
  16.         

  17.     #3. 保存数据
  18.     def sava_data(self,data,name):
  19.         a = "images/"+name
  20.         with open(a,"wb") as f:
  21.             f.write(data)
  22.    


  23.     #4. 主要逻辑
  24.     def run(self):
  25.         response_data = self.send_request(self.url)
  26.         img_xpath = "//div['@class=center']/a/@href"

  27.         image_url_list = self.data_cleansing(response_data, img_xpath)
  28.         image_url = self.url+ image_url_list[17]
  29.         page = [image_url+"?pageSize=28&pageNumber={}".format(i) for i in range(0,12)]

  30.         for page_num in page:
  31.             print(page_num)
  32.             page_data = self.send_request(page_num)
  33.             gage_xpath = '//div[@class="up clearfix"]/a/figure/div/video/@src'
  34.             page_url_list = self.data_cleansing(page_data, page_xpath)

  35.             for page_url in page_url_lsit:
  36.                 mp4_data= self.send_request(page_url)
  37.                 image_name = page_url[-10:]
  38.                 self.sava_data(mp4_data, image_name)
  39.             
  40. if __name__ == '__main__':
  41.     graph = Dynamic()
  42.     graph.run()
复制代码


怎么打印不出来,哪里错了
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2019-4-19 22:23:10 | 显示全部楼层
self.headers={"User-Agent":"Mozilla/5.0 (Windows NT 5.1)AppleWebKit/537.36(KHTML, like Gecko) Chrome/56.0.2924.90 Safari/537.36 2345Explorer/9.7.0.18838"}
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-4-19 22:23:28 | 显示全部楼层
self.headers={"User-Agent":"Mozilla/5.0 (Windows NT 5.1)AppleWebKit/537.36(KHTML, like Gecko) Chrome/56.0.2924.90 Safari/537.36 2345Explorer/9.7.0.18838"}
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-4-19 22:26:04 | 显示全部楼层
{"User-Agent":"
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-4-20 16:12:43 | 显示全部楼层
两个地方错了:
1.如上,headers里的字典用法错了。引号少打了
2.gage_xpath = '//div[@class="up clearfix"]/a/figure/div/video/@src'
for page_url in page_url_lsit:
这两句有错误,变量名你打错了。‘

程序你写完了都不执行下的吗’
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2019-4-20 20:01:56 | 显示全部楼层
万中山 发表于 2019-4-20 16:12
两个地方错了:
1.如上,headers里的字典用法错了。引号少打了
2.gage_xpath = '//div[@class="up clearf ...

怎么改,哪里错了
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-4-20 20:25:31 | 显示全部楼层
过默 发表于 2019-4-20 20:01
怎么改,哪里错了

那2楼 3楼的 你都不看吗  还问咋改
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2019-4-20 20:36:49 | 显示全部楼层
wp231957 发表于 2019-4-20 20:25
那2楼 3楼的 你都不看吗  还问咋改
  1. import requests
  2. from lxml import etree



  3. class Dynamic(object):
  4.     def __init__(self):
  5.         self.url = "https://www.soogif.com"
  6.         self.headers={"User-Agent":"Mozilla/5.0(Windows NT 5.1)AppleWebKit/537.36(KHTML, like Gecko) Chrome/56.0.2924.90 Safari/537.36 2345Explorer/9.7.0.18838"}


  7.     #1. 发送请求获取响应
  8.     def send_request(self, url):
  9.         response = requests.get(url, headers=self.headers)
  10.         return response.content

  11.     #2. 数据筛选
  12.     def data_cleansing(self,data, rel):
  13.         element = etree.HTML(data)
  14.         html_xpath = element.xpath(rel)
  15.         return html_xpath
  16.         

  17.     #3. 保存数据
  18.     def sava_data(self,data,name):
  19.         a = "images/"+name
  20.         with open(a,"wb") as f:
  21.             f.write(data)
  22.    


  23.     #4. 主要逻辑
  24.     def run(self):
  25.         response_data = self.send_request(self.url)
  26.         img_xpath = "//div['@class=center']/a/@href"

  27.         image_url_list = self.data_cleansing(response_data, img_xpath)
  28.         image_url = self.url+ image_url_list[17]
  29.         page = [image_url+"?pageSize=28&pageNumber={}".format(i) for i in range(0,12)]

  30.         for page_num in page:
  31.             print(page_num)
  32.             page_data = self.send_request(page_num)
  33.             page_xpath = '//div[@class="up clearfix"]/a/figure/div/video/@src'
  34.             page_url_list = self.data_cleansing(page_data, page_xpath)

  35.             for page_url in page_url_lsit:
  36.                 mp4_data= self.send_request(page_url)
  37.                 image_name = page_url[-10:]
  38.                 self.sava_data(mp4_data, image_name)
  39.             
  40. if __name__ == '__main__':
  41.     graph = Dynamic()
  42.     graph.run()
复制代码


怎么改
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-4-21 10:45:51 | 显示全部楼层
  1. page_url_list = self.data_cleansing(page_data, page_xpath)

  2.             for page_url in page_url_lsit:
复制代码


多么低级的错误啊

  for page_url in page_url_lsit:
NameError: name 'page_url_lsit' is not defined
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-4-21 10:54:28 | 显示全部楼层

按照9楼的修正之后,代码可以跑起来

不过 目录名 命名比较奇葩  下载回来的是一堆mp4  文件夹确实images 名字
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2019-4-21 11:33:48 | 显示全部楼层
wp231957 发表于 2019-4-21 10:45
多么低级的错误啊

  for page_url in page_url_lsit:

怎么改不知道
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-4-21 11:37:12 | 显示全部楼层

你一点都不懂英文吗
for page_url in page_url_lsit:
NameError: name 'page_url_lsit' is not defined

我也不懂英文,但是也能猜到一些

在   for page_url in page_url_lsit: 这个语句中发现NameError: 一个名字叫page_url_lsit的变量没有被定义
至于怎么改  请参看9楼  
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2019-4-21 11:42:04 | 显示全部楼层
wp231957 发表于 2019-4-21 11:37
你一点都不懂英文吗
for page_url in page_url_lsit:
NameError: name 'page_url_lsit' is not define ...
  1. import requests
  2. from lxml import etree



  3. class Dynamic(object):
  4.     def __init__(self):
  5.         self.url = "https://www.soogif.com"
  6.         self.headers={"User-Agent":"Mozilla/5.0(Windows NT 5.1)AppleWebKit/537.36(KHTML, like Gecko) Chrome/56.0.2924.90 Safari/537.36 2345Explorer/9.7.0.18838"}


  7.     #1. 发送请求获取响应
  8.     def send_request(self, url):
  9.         response = requests.get(url, headers=self.headers)
  10.         return response.content

  11.     #2. 数据筛选
  12.     def data_cleansing(self,data, rel):
  13.         element = etree.HTML(data)
  14.         html_xpath = element.xpath(rel)
  15.         return html_xpath
  16.         

  17.     #3. 保存数据
  18.     def sava_data(self,data,name):
  19.         a = "images/"+name
  20.         with open(a,"wb") as f:
  21.             f.write(data)
  22.    


  23.     #4. 主要逻辑
  24.     def run(self):
  25.         response_data = self.send_request(self.url)
  26.         img_xpath = "//div['@class=center']/a/@href"

  27.         image_url_list = self.data_cleansing(response_data, img_xpath)
  28.         image_url = self.url+ image_url_list[17]
  29.         page = [image_url+"?pageSize=28&pageNumber={}".format(i) for i in range(0,12)]

  30.         for page_num in page:
  31.             print(page_num)
  32.             page_data = self.send_request(page_num)
  33.             page_xpath = '//div[@class="up clearfix"]/a/figure/div/video/@src'
  34.             page_url_list = self.data_cleansing(page_data, page_xpath)

  35.             for page_url in page_url_lsit:
  36.                 mp4_data= self.send_request(page_url)
  37.                 image_name = page_url[-10:]
  38.                 self.sava_data(mp4_data, image_name)
  39.             
  40. if __name__ == '__main__':
  41.     graph = Dynamic()
  42.     graph.run()
复制代码


还是错
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-4-21 11:46:09 | 显示全部楼层

你没有改掉错误的地方 ,当然错了

这是你自己马虎的缘故,所以建议你自己取发现错误并改正
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-4-21 11:49:58 | 显示全部楼层

其他代码都没错,错误的代码 我已经在9楼贴出来了
谁 知道你是不看  还是不会看啊  不论是不看  还是不会看  都不可饶恕
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-7-13 22:57

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表