鱼C论坛

 找回密码
 立即注册
查看: 2444|回复: 8

[已解决]关于用python抓取豆瓣图书信息的相关问题

[复制链接]
发表于 2017-10-23 13:11:17 | 显示全部楼层 |阅读模式
100鱼币
本帖最后由 mskyer 于 2017-10-23 13:16 编辑

各位大佬们好,我最近在做一个关于电子书分享的网站,需要抓取豆瓣图书的相关信息,遇到了一些问题,一直没有办法解决,所以看看鱼友们有没有办法。我把电子书的书名放到一个txt文件中(每行一个),然后再把书名放到豆瓣图书上搜索,抓取相应图书的链接。问题就出在这里。
以搜索《巨人的陨落》这本书为例,URL为:https://book.douban.com/subject_search?search_text=巨人的陨落&cat=1001,
傲游截图20171023130728.png

但是查看源代码,里面居然是乱码:
傲游截图20171023130750.png


不知道大家在遇到这个问题的时候是怎么处理的,在线急等~
最佳答案
2017-10-23 13:11:18
selenium

最佳答案

小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2017-10-23 13:11:18 | 显示全部楼层    本楼为最佳答案   
selenium
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2017-10-23 13:19:32 | 显示全部楼层
想必你已经实现了抓取代码,为什么不把代码贴出来呢?
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2017-10-23 17:00:09 | 显示全部楼层
[b]有没有人啊,来个大神来解决咯[b][/b][/b]
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2017-10-23 17:51:55 | 显示全部楼层
你显然是不用在乎那一段乱糟糟的。
你想要的书名字就是中文啊
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2017-10-23 23:25:21 From FishC Mobile | 显示全部楼层
新手·ing 发表于 2017-10-23 17:51
你显然是不用在乎那一段乱糟糟的。
你想要的书名字就是中文啊

我要的书名对应的豆瓣连接啊
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2017-10-24 09:44:41 | 显示全部楼层
不要看源代码,看审查元素。你要的这些都在a标签里面
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2017-10-24 16:31:18 | 显示全部楼层
ooxx7788 发表于 2017-10-24 09:44
不要看源代码,看审查元素。你要的这些都在a标签里面

我要的东西都在这段加密的代码里了
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2017-10-24 19:25:00 | 显示全部楼层
mskyer 发表于 2017-10-24 16:31
我要的东西都在这段加密的代码里了

那么我只有祭出大杀器selenium
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2026-3-3 08:11

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表