Stubborn 发表于 2019-6-7 17:18:28

数据采集指--字体反爬

介绍下,什么是字体反爬,如下:
        字体文件本质上是从字符到图像的一个映射。比如字符0,浏览器会从字体文件当中找到0这个字符对应的图像,然后展示出来。如果字符0展示并不是0的图像是1的图像呢?这也就意味着爬虫拿到的是字符0,但是人看到的却是图像1。而我们知道::一切从字符到图像的映射,都可以用来反爬。
举个举个:目标网站

如上,我们可以很明显的看到,需要的数据,在网页显示,并不能正常显示,因为网站定义了一套自己的字体,再去检查下网页源码

你发现,对应的部分是这样的。需要拿到字体文件,找到相应的映射就可以解决,我也是初学,说不清,上代码了。
**** Hidden Message *****

kaohsing 发表于 2019-6-8 12:59:57

学习一下

virtuallwh 发表于 2019-6-26 17:16:18

1

Recado 发表于 2019-6-27 14:36:21

{:10_256:}

害怕型全嘲豪 发表于 2019-6-27 15:30:19

没细看 , 不过 这个情况 一般用 Fiddler 抓抓 json 包 应该就有了.

ovsexia 发表于 2019-6-27 16:54:28

{:10_266:}

glowrush 发表于 2019-6-30 17:34:03

{:5_102:}

小小小菜菜菜 发表于 2019-7-3 09:19:59

666

小黑不黑12138 发表于 2019-7-3 09:27:37

学习一下

单纯的+c 发表于 2019-7-24 01:14:36

学习一下

彩虹七号 发表于 2019-8-31 15:04:11

回复

HaiGui 发表于 2019-8-31 15:47:16

666666

NikoRobin 发表于 2019-10-8 11:50:33

学习

kaibin051525 发表于 2019-10-8 21:52:08

I LOVE FISHC

XiaoPaiShen 发表于 2019-10-9 06:44:47

take a look

birdd 发表于 2019-10-10 16:30:20

看一看

奕997 发表于 2019-11-25 16:01:58

{:10_277:}

LJZheng 发表于 2019-11-29 21:25:56

{:10_256:}

Albertdjy 发表于 2020-8-18 10:47:16

学习
页: [1]
查看完整版本: 数据采集指--字体反爬