鱼C论坛

 找回密码
 立即注册
查看: 3800|回复: 2

[技术交流] 解析一个网站:

[复制链接]
发表于 2020-2-26 10:07:03 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
本帖最后由 wp231957 于 2020-2-26 13:46 编辑

发现无法使用鼠标右键,尝试网上N种办法 无效,于是继续努力:

1、复制源码(还好F12能用) 另存为本地html
2、使用file协议 运行该html,发现会强制跳转
   发现:
  1. <script>
  2.     if(window.location.href.indexOf('enterdesk.com')==-1)
  3.     {
  4.         window.location.href="https://www.enterdesk.com"
  5.     }
  6. </script>
复制代码

删除之,继续
3、查看css文档,可以确定  不是通过css禁用鼠标右键

4、发现PUBLIC.JS中存在以下代码

  1. $(document).ready(function(){
  2.     $(document).bind("contextmenu",function(e){
  3.         return false;
  4.     });
  5.     $(document).bind("selectstart",function(){return false;});
  6. });
复制代码


百度得知,第一个是绑定鼠标右键事件   false 为禁止
                第二个是绑定鼠标选择区域事件   flase  为禁止
               
把这段代码 删除,于是乎,鼠标右键 管用,此时 本地html 分析结束

继续实战:,以上是针对本地html的分析和实现,下面针对web网页进行测试:
经过了N++次 实验,终于成功一次:

$(document).unbind("contextmenu");      //此条代码再F12控制台下获取成功

javascript:$(document).unbind("contextmenu");  //此条代码再地址栏下 获取成功
$(document).unbind("contextmenu");   //这个代码再地址栏下 不会成功

补充:再地址栏里输入javascript代码  再edge浏览器里遭遇失败,需要再地址栏输入about:flags  把和javascript相关的开关开启  否则 它都给你当字符串处理



小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2020-2-26 20:07:43 | 显示全部楼层
爬虫部分:
此部分倒是没有遇到什么坎坷:

  1. import requests
  2. from lxml import etree


  3. headers={"User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3947.100 Safari/537.36"}
  4. pages=0
  5. for page in range(1,779):
  6.     url="https://www.enterdesk.com/zhuomianbizhi/%s.html"%page
  7.     reponse=requests.get(url=url,headers=headers)
  8.     reponse.encoding=("utf-8")
  9.     tree = etree.HTML(reponse.text)
  10.     data=tree.xpath("//img/@src")
  11.     for x in data:
  12.        pages+=1
  13.        imgcontent=requests.get(x)
  14.        with open(r'/pic/enterdesk/'+x.split("/")[-1], 'wb') as file:
  15.            file.write(imgcontent.content)
  16. print("共计%d张图片被下载"%pages)           


  17. '''
  18. e:\>python ex20.py
  19. 共计12448张图片被下载
  20. '''
复制代码

就是浪费了我不少时间,一万多张图片 被成功下载
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-3-4 10:24:24 | 显示全部楼层
学习学习
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-5-5 11:44

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表