Stubborn
发表于 2019-6-7 17:18:28
数据采集指--字体反爬
介绍下,什么是字体反爬,如下:
字体文件本质上是从字符到图像的一个映射。比如字符0,浏览器会从字体文件当中找到0这个字符对应的图像,然后展示出来。如果字符0展示并不是0的图像是1的图像呢?这也就意味着爬虫拿到的是字符0,但是人看到的却是图像1。而我们知道::一切从字符到图像的映射,都可以用来反爬。
举个举个:目标网站
如上,我们可以很明显的看到,需要的数据,在网页显示,并不能正常显示,因为网站定义了一套自己的字体,再去检查下网页源码
你发现,对应的部分是这样的。需要拿到字体文件,找到相应的映射就可以解决,我也是初学,说不清,上代码了。
**** Hidden Message *****
kaohsing
发表于 2019-6-8 12:59:57
学习一下
virtuallwh
发表于 2019-6-26 17:16:18
1
Recado
发表于 2019-6-27 14:36:21
{:10_256:}
害怕型全嘲豪
发表于 2019-6-27 15:30:19
没细看 , 不过 这个情况 一般用 Fiddler 抓抓 json 包 应该就有了.
ovsexia
发表于 2019-6-27 16:54:28
{:10_266:}
glowrush
发表于 2019-6-30 17:34:03
{:5_102:}
小小小菜菜菜
发表于 2019-7-3 09:19:59
666
小黑不黑12138
发表于 2019-7-3 09:27:37
学习一下
单纯的+c
发表于 2019-7-24 01:14:36
学习一下
彩虹七号
发表于 2019-8-31 15:04:11
回复
HaiGui
发表于 2019-8-31 15:47:16
666666
NikoRobin
发表于 2019-10-8 11:50:33
学习
kaibin051525
发表于 2019-10-8 21:52:08
I LOVE FISHC
XiaoPaiShen
发表于 2019-10-9 06:44:47
take a look
birdd
发表于 2019-10-10 16:30:20
看一看
奕997
发表于 2019-11-25 16:01:58
{:10_277:}
LJZheng
发表于 2019-11-29 21:25:56
{:10_256:}
Albertdjy
发表于 2020-8-18 10:47:16
学习
页:
[1]