Blueskyyy 发表于 2023-2-10 10:54:54

爬某网图片时发现图片路径有上前字符

本人小白一枚,自学的python,最近在尝试爬网图练手.爬某网图片时发现图片路径有上千字符(3600+).每张图片的开头都是data:image/jpeg;base64,/9j/4AAQSkZJRgABAQEAYABgAAD// 然后接下来就是长达3000+的字符.这个是加密造成的吗?还是通过什么办法防止爬?虚心求教blob:https://fishc.com.cn/c1a046d3-663f-4653-a7d3-d7a96d51bf2b
另外本人除了python和vba啥都不会,现在也不知道从哪开始学,在想是不是如果爬数据方向的得学正则表达式和Json?其他还需要学什么知识?求教.(不太会玩贴吧,见谅)

isdkz 发表于 2023-2-10 11:01:56

这个不是加密,是 base64编码,二进制文件在进行base64编码后再传输很正常,否则可能会丢失一些字节

sfqxx 发表于 2023-2-10 16:30:42

学习了

cflying 发表于 2023-2-13 16:54:19

本帖最后由 cflying 于 2023-2-13 16:55 编辑

哈哈,LZ这个问题是属于基础知识不过关,应该学点前端基础知识,这样就顺手了,正常学习步骤是先学基数知识,再学工具,你这个是先自学了工具,所以会写但是看不懂是什么,补点基础知识就OK了

歌者文明清理员 发表于 2023-2-13 22:31:31

厉害,作为爬虫失败者我连提问者这段话都听不懂e

Blueskyyy 发表于 2023-2-15 22:04:17

isdkz 发表于 2023-2-10 11:01
这个不是加密,是 base64编码,二进制文件在进行base64编码后再传输很正常,否则可能会丢失一些字节

非常感谢,一看到你说base64,立马百度就解决代码问题了.另外也补了base64的知识,非常感谢.

Blueskyyy 发表于 2023-2-15 22:05:41

cflying 发表于 2023-2-13 16:54
哈哈,LZ这个问题是属于基础知识不过关,应该学点前端基础知识,这样就顺手了,正常学习步骤是先学基数知识 ...

是的,因为本身不是计算机专业,头脑一热想学一下python,结果学完了发现根本没有基础知识之城,太难了.

Blueskyyy 发表于 2023-2-15 22:06:22

歌者文明清理员 发表于 2023-2-13 22:31
厉害,作为爬虫失败者我连提问者这段话都听不懂e

同为爬虫失败者{:5_104:}
页: [1]
查看完整版本: 爬某网图片时发现图片路径有上前字符