Sablier 发表于 2019-5-2 18:16:09

这都被你发现了

一X一 发表于 2019-5-2 19:57:45

{:5_108:}学习xuex

wleo96 发表于 2019-5-4 12:58:30

66

wangyaoxin 发表于 2019-5-5 08:30:59

大哥 能解释一下代码吗

wangyaoxin 发表于 2019-5-5 08:37:30

大神 您能解释一下44-56行的代码含义吗

wangyaoxin 发表于 2019-5-5 15:42:36

冷小漠 发表于 2018-6-10 14:49
看了楼主的代码,总结了一下思路:

百度文库比较特殊,虽然抓包可以抓得到,但是文章的api很难逆向,至 ...

第44-56行是什么意思呢?可以解释一下吗?

1046787299 发表于 2019-5-5 19:16:50

来试试能用不!

sunyuanency 发表于 2019-5-5 21:34:43

这么嗨啊{:10_256:}

太白紫星 发表于 2019-5-6 09:48:29

学习学习

蜜獾 发表于 2019-5-6 10:19:39

谢谢大佬的分享我是过来学习的

C'rɑごy 发表于 2019-5-7 22:20:19

666

yangsuj 发表于 2019-5-8 20:00:00

OJBK

zhangyf123 发表于 2019-5-9 13:10:04

..

冷小漠 发表于 2019-5-12 23:33:18

wangyaoxin 发表于 2019-5-5 15:42
第44-56行是什么意思呢?可以解释一下吗?

简单来说吧,时间过去太久我也不太清楚了,又懒得再跑代码

就是百度文库的文档类型不是单一的,通过判断不同的文档类型使用不同的解析函数,你说的44-56行parse_text就是对text类型的文档解析

凯旋16 发表于 2019-5-13 10:43:21

向大神学习

CLPython 发表于 2019-5-13 11:13:31

                hh

kissoul 发表于 2019-5-16 16:42:01

{:10_277:}

江都梅雪 发表于 2019-5-25 15:45:39

        鱼C有你更精彩^_^

靳小昭 发表于 2019-5-29 20:40:05

看看

2434849827 发表于 2019-5-30 11:50:48

zhichi
页: 26 27 28 29 30 31 32 33 34 35 [36] 37 38 39 40 41 42 43 44 45
查看完整版本: 百度文库爬虫(爬取需要下载券的文档)