设为首页收藏本站

切换到窄版

鱼C论坛»论坛 › 萌新训练营 › 萌新交流区 › 起点小说的爬虫

发新帖

查看: 5855|回复: 1

[已解决]起点小说的爬虫

发表于 2018-2-7 23:38:05 | 显示全部楼层 |阅读模式

20鱼币

本帖最后由 py大神于 2018-2-9 23:00 编辑

想写一个起点小说的排行榜爬虫，但是爬下来的网页却是一串js代码？
捕获.PNG

捕获.PNG

这是URL：https://www.qidian.com/rank

这是代码：

import urllib.request
url = "https://www.qidian.com/rank"
header = {"User-Agent":"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/62.0.3202.89 Safari/537.36"}
req = urllib.request.Request(url=url,headers=header)
response = urllib.request.urlopen(url)
html = response.read().decode("utf-8")
print(html)

复制代码

排行榜的内容在哪呢？

最佳答案

月排行榜 / 总排行榜

孤独的嫖客

2018-2-7 23:38:06

本帖最后由孤独的嫖客于 2018-2-9 23:30 编辑

晚上好,朋友,其实你的这个问题已经出结果了,忘了回复.....排行榜的内容就在返回值里,

TIM截图20180209232333.png

当然,我自己又把这个问题需求更新了一下,如:
如何以不同的排行榜存储各个小说??
最后也解决了这个需求,成果如下:

TIM图片20180209232539.png

TIM图片20180209232544.png

附:图是我另外一个朋友的图,但是研究过程是我和他一起讨论的,我这里就偷了个懒,直接拿他的图做个例子.
如想知道新需求的源码,可以加python学习小组,692858412Python基础/爬虫,一起学习讨论,内含摆渡云不限速新人福利

跳转到最佳答案楼层

最佳答案

孤独的嫖客

查看完整内容

晚上好,朋友,其实你的这个问题已经出结果了,忘了回复.....排行榜的内容就在返回值里, 当然,我自己又把这个问题需求更新了一下,如: 如何以不同的排行榜存储各个小说?? 最后也解决了这个需求,成果如下: 附:图是我另外一个朋友的图,但是研究过程是我和他一起讨论的,我这里就偷了个懒,直接拿他的图做个例子. 如想知道新需求的源码,可以加python学习小组,692858412Python基础/爬虫,一起学习讨论,内含摆渡云不限速新人福利{:7 ...

小甲鱼最新课程 -> https://ilovefishc.com

回复

使用道具举报

孤独的嫖客

发表于 2018-2-7 23:38:06 | 显示全部楼层本楼为最佳答案

这个最佳答案由孤独的嫖客给出，感谢孤独的嫖客的回答。

单击隐藏图章

本帖最后由孤独的嫖客于 2018-2-9 23:30 编辑

晚上好,朋友,其实你的这个问题已经出结果了,忘了回复.....排行榜的内容就在返回值里,

TIM截图20180209232333.png

当然,我自己又把这个问题需求更新了一下,如:
如何以不同的排行榜存储各个小说??
最后也解决了这个需求,成果如下:

TIM图片20180209232539.png

TIM图片20180209232544.png

附:图是我另外一个朋友的图,但是研究过程是我和他一起讨论的,我这里就偷了个懒,直接拿他的图做个例子.
如想知道新需求的源码,可以加python学习小组,692858412Python基础/爬虫,一起学习讨论,内含摆渡云不限速新人福利

小甲鱼最新课程 -> https://ilovefishc.com

回复

使用道具举报

发新帖

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2026-5-26 17:35

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表