饺子包子 发表于 2018-7-17 16:21:41

公主家的喵 发表于 2018-7-10 23:33
为什么会报错额。。
File "C:/Users/Administrator/PycharmProjects/untitled1/百度文库", line 63
    ...

你这个应该是转义字符的问题,你吧双引号里面的\换成\\试试

饺子包子 发表于 2018-7-17 17:19:55

冷小漠 发表于 2018-6-10 14:49
看了楼主的代码,总结了一下思路:

百度文库比较特殊,虽然抓包可以抓得到,但是文章的api很难逆向,至 ...

一开始运行的时候报错,应该是转义字符的问题,我将\换成了\\就通过了,但是下载下来的是两个图片,大小均为0,请教一下这个是什么问题

饺子包子 发表于 2018-7-17 17:23:15

冷小漠 发表于 2018-6-10 14:49
看了楼主的代码,总结了一下思路:

百度文库比较特殊,虽然抓包可以抓得到,但是文章的api很难逆向,至 ...

一开始运行的时候报错,应该是转义字符的问题,我将\换成了\\就通过了,但是下载下来的是两个图片,大小均为0,请教一下这个是什么问题

冷小漠 发表于 2018-7-19 13:44:08

饺子包子 发表于 2018-7-17 17:23
一开始运行的时候报错,应该是转义字符的问题,我将\换成了\\就通过了,但是下载下来的是两个图片,大小 ...

这个应该是某个文档的问题吧,不一定全部都能下载的

饺子包子 发表于 2018-7-19 17:56:33

冷小漠 发表于 2018-7-19 13:44
这个应该是某个文档的问题吧,不一定全部都能下载的

我使用就是那个示例里面的网址。。。

冷小漠 发表于 2018-7-19 21:53:32

饺子包子 发表于 2018-7-19 17:56
我使用就是那个示例里面的网址。。。

我以为是百度文库的问题,但是我尝试获取确实是可以得到json的

饺子包子 发表于 2018-7-20 19:14:34

冷小漠 发表于 2018-7-19 21:53
我以为是百度文库的问题,但是我尝试获取确实是可以得到json的

对,这个不知道是咋回事儿,明天在研究研究,有啥进展咱们再沟通,一起学习学习

mashang 发表于 2018-7-21 06:45:54

这么神奇的吗,不用下载券

mohunweixue 发表于 2018-7-21 12:42:34

谢谢!!下载来看看

Fight007 发表于 2018-7-21 15:44:24

学习

wyqflysun 发表于 2018-7-21 21:12:43

{:10_277:{:10_277:}

我把明月比此心 发表于 2018-7-22 14:20:15

学习一下

x402866067 发表于 2018-7-22 20:34:15

谢谢大佬分享

墨尔本n60 发表于 2018-7-22 20:44:30

支持支持

褪色 发表于 2018-7-23 05:25:41

给力

wunai_next 发表于 2018-7-23 08:50:49

看一下

love-vitex 发表于 2018-7-23 08:56:10

百度文库爬虫

18307521742 发表于 2018-7-23 13:53:58

围观围观!

kaibun 发表于 2018-7-23 14:05:26

感谢分享!!

阿乐biaji 发表于 2018-7-23 15:14:01

看一看
页: 4 5 6 7 8 9 10 11 12 13 [14] 15 16 17 18 19 20 21 22 23
查看完整版本: 百度文库爬虫(爬取需要下载券的文档)