鱼C论坛

 找回密码
 立即注册
查看: 13683|回复: 57

[技术交流] [小练习]当爬虫遇到521的时候

[复制链接]
发表于 2020-9-26 17:45:10 | 显示全部楼层 |阅读模式
50鱼币
今天在写一个爬虫的时候遇到了一个情况,http返回的状态码是521,应该是一个安全公司的反爬技术,返回的response是一段js代码,用来设置cookies,只有设置了cookies的session才能正常访问,以前遇到的情况,都是一段混淆过的js代码,基本没办法反编译,都是通过python的第三方库来获取结果,今天好不容易遇到一个js代码还算清晰的,无聊的鱼友们没事拿来练练手,最好先自己写写,再来看我的代码。

目的是给一段js,得到想要的字符串
  1. js1 = "<script>document.cookie=('_')+('_')+('j')+('s')+('l')+('_')+('c')+('l')+('e')+('a')+('r')+('a')+('n')+('c')+('e')+('_')+('s')+('=')+(-~{}+'')+((1+[2])/[2]+'')+(~~[]+'')+((+true)+'')+(-~false+'')+(-~[]+'')+(~~{}+'')+(3+5+'')+(8+'')+((+false)+'')+('.')+([2]*(3)+'')+(3+'')+(2+2+'')+('|')+('-')+(-~false+'')+('|')+('W')+('h')+('h')+('u')+('Z')+('h')+('l')+('%')+(2+'')+('F')+('%')+(+!+[]*2+'')+('F')+('y')+('%')+((1<<1)+'')+('B')+(~~[]+'')+('D')+('r')+('c')+('U')+('V')+(9-1*2+'')+('P')+('I')+(4+5+'')+('a')+('J')+('E')+('t')+('R')+('c')+('%')+((1+[2]>>2)+'')+('D')+(';')+('m')+('a')+('x')+('-')+('a')+('g')+('e')+('=')+(3+'')+(3+3+'')+(~~''+'')+(~~[]+'')+(';')+('p')+('a')+('t')+('h')+('=')+('/');location.href=location.pathname+location.search</script>"
  2. js2 = "<script>document.cookie=('_')+('_')+('j')+('s')+('l')+('_')+('c')+('l')+('e')+('a')+('r')+('a')+('n')+('c')+('e')+('=')+(-~{}+'')+((1+[2])/[2]+'')+(~~[]+'')+((+true)+'')+(-~false+'')+(-~[]+'')+(~~{}+'')+(3+6+'')+(4+'')+((1<<2)+'')+('.')+(1+4+'')+(7+'')+(2+5+'')+('|')+('-')+(-~false+'')+('|')+('I')+(2+'')+('k')+('R')+((1+[2])/[2]+'')+('X')+('h')+(2+5+'')+('N')+('q')+('D')+('S')+('P')+('G')+('B')+('a')+('u')+('G')+('c')+('H')+('H')+(-~[5]+'')+('j')+('F')+(+!+[]*2+'')+('u')+(4+4+'')+('%')+((1+[2]>>2)+'')+('D')+(';')+('m')+('a')+('x')+('-')+('a')+('g')+('e')+('=')+(3+'')+(';')+('p')+('a')+('t')+('h')+('=')+('/');location.href=location.pathname+location.search</script>"
  3. js3 = "<script>document.cookie=('_')+('_')+('j')+('s')+('l')+('_')+('c')+('l')+('e')+('a')+('r')+('a')+('n')+('c')+('e')+('=')+(-~{}+'')+((1+[2])/[2]+'')+(~~[]+'')+((+true)+'')+(-~false+'')+(-~[]+'')+(-~false+'')+(~~false+'')+((+[])+'')+((1+[2])/[2]+'')+('.')+(2+7+'')+(8+'')+('|')+('-')+(-~false+'')+('|')+('v')+('x')+('x')+('c')+('F')+('s')+('l')+('U')+(1+2+'')+(-~[5]+'')+('S')+(+!+[]+'')+('Y')+(~~false+'')+(-~[2]+'')+((1<<2)+'')+('T')+('K')+('b')+(4+5+'')+('%')+(+!+[]*2+'')+('F')+(9+'')+('W')+(~~''+'')+((1+[0])/[2]+'')+('I')+('g')+('%')+(-~[2]+'')+('D')+(';')+('m')+('a')+('x')+('-')+('a')+('g')+('e')+('=')+((1|2)+'')+(';')+('p')+('a')+('t')+('h')+('=')+('/');location.href=location.pathname+location.search</script>"
  4. js_list = [js1, js2, js3]

  5. def js_to_str(js):


  6. if __name__ == '__main__':
  7.     for e in js_list:
  8.         print(js_to_str(e))
复制代码


得到的结果应该是:
  1. __jsl_clearance_s=1601110880.634|-1|WhhuZhl%2F%2Fy%2B0DrcUV7PI9aJEtRc%3D;max-age=3600;path=/
  2. __jsl_clearance=1601110944.577|-1|I2kR6Xh7NqDSPGBauGcHH6jF2u8%3D;max-age=3;path=/
  3. __jsl_clearance=1601111006.98|-1|vxxcFslU36S1Y034TKb9%2F9W05Ig%3D;max-age=3;path=/
复制代码


有兴趣的可以研究一下,最佳就给代码清晰简单的,我的代码在下面
游客,如果您要查看本帖隐藏内容请回复

评分

参与人数 2荣誉 +4 鱼币 +4 贡献 +3 收起 理由
Stubborn + 3 + 3 + 3
xiangjianshinan + 1 + 1 鱼C有你更精彩^_^ 看不懂~~~

查看全部评分

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-9-28 17:06:22 | 显示全部楼层
我来康康一下
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-9-29 00:35:57 | 显示全部楼层
看看
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-9-29 07:12:05 | 显示全部楼层
我来看看!
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-9-29 11:38:10 | 显示全部楼层
让 江小白 来看看帖子里藏了啥好东西~~~
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-9-29 12:35:50 | 显示全部楼层
不懂。。。。。。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-9-29 19:16:35 From FishC Mobile | 显示全部楼层
看看
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-9-29 20:55:52 | 显示全部楼层
看看
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-9-29 21:34:15 | 显示全部楼层
666
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

头像被屏蔽
发表于 2020-9-30 06:59:17 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-9-30 20:02:05 | 显示全部楼层
看看答案
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-9-30 20:58:03 | 显示全部楼层
A
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-9-30 21:00:03 | 显示全部楼层
1
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-10-5 19:23:43 | 显示全部楼层
看看
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-10-6 23:46:20 | 显示全部楼层
给网址先呗。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

头像被屏蔽
发表于 2020-10-7 18:07:06 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-10-18 22:57:29 | 显示全部楼层
看不懂
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-10-19 11:26:23 From FishC Mobile | 显示全部楼层
看看
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-10-19 15:11:44 | 显示全部楼层
康康~
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-10-20 12:33:09 | 显示全部楼层
1
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-4-24 12:28

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表