鱼C论坛

 找回密码
 立即注册
楼主: 人造人

[作品展示] Python爬取斗破苍穹漫画

  [复制链接]
发表于 2018-10-20 12:49:39 | 显示全部楼层
感谢分享
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-10-20 16:14:50 | 显示全部楼层
感谢分享
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-10-20 17:02:22 | 显示全部楼层
学习一下
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-10-20 18:17:57 | 显示全部楼层
感兴趣
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-10-21 13:05:47 | 显示全部楼层
666
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2018-10-21 13:46:07 | 显示全部楼层
写得很好诶,支持一下
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-10-21 17:48:21 | 显示全部楼层
看一下  谢谢了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-10-21 18:50:25 | 显示全部楼层
123123123
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-10-21 20:08:58 | 显示全部楼层
观摩观摩
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-10-21 21:11:59 | 显示全部楼层
呀呀呀呀呀呀呀呀呀呀呀呀呀呀呀呀呀呀呀呀呀呀呀呀呀呀呀呀呀呀呀呀呀
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-10-21 21:35:01 | 显示全部楼层
谢谢大大
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-10-21 22:18:45 | 显示全部楼层
膜拜大佬
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-10-21 22:58:50 | 显示全部楼层
观看一下大佬的代码
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-10-21 23:18:15 | 显示全部楼层
haha
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2018-10-21 23:19:39 | 显示全部楼层
学习学习
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-10-22 10:16:46 | 显示全部楼层
谢谢分享
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-10-22 12:14:07 | 显示全部楼层
看看
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2018-10-22 17:12:49 | 显示全部楼层
大佬你好,我是开始学python的新手,想看看你的代码学习一下
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-10-22 22:48:49 | 显示全部楼层
想问下楼主   我也试了一下写这个爬虫 遇到一个问题 就是获取图片链接,第一次方式我是考虑直接换图片链接里面的页码就可以了,方便。 但我没找到那里可以直接获取到这一章节的图片张数。  另一种就是通过JS 查看本张图片链接和下载图片链接 这我没找到 也不太懂JS
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2018-10-22 23:12:42 | 显示全部楼层
暗夜之隐 发表于 2018-10-22 22:48
想问下楼主   我也试了一下写这个爬虫 遇到一个问题 就是获取图片链接,第一次方式我是考虑直接换图片链接 ...

1.png

这些信息保存在 mh_info 里面

  1. var mh_info={imgpath:"L-:N-M>-A>-A?-M?-I8-J<-M@-@J-@L-M?-IA-JA-M>-@J-@>-M=-@@-@>-M?-@A-@@-:N9-M@-IN-AL-:N",startimg:1,totalimg:13,mhid:"doupocangqiong",mhname:"斗破苍穹",pageid:1400558,pagename:"第1话 陨落的天才(上)",pageurl:"dpcq_1h",readmode:1,maxpreload:5,defaultminline:1,domain:"cnmanhua.com",comic_size:"-mht.middle",default_price:0,price:0,time_diff:37232112573};var cnzz_comic = ["_trackEvent","斗破苍穹","mht_"+(isMobile?"wap":"pc"),"",0];_czc = [["_setAccount", "1261814609"]];_czc.push(cnzz_comic);  /* 图片加载时cnzz事件统计 */
复制代码

  1. var mh_info={imgpath:"L-:N-M>-A>-A?-M?-I8-J<-M@-@J-@L-M?-IA-JA-M>-@J-@>-M=-@@-@>-M?-@A-@@-:N9-M@-IN-AL-:N",startimg:1,totalimg:13,mhid:"doupocangqiong",mhname:"斗破苍穹",pageid:1400558,pagename:"第1话 陨落的天才(上)",pageurl:"dpcq_1h",readmode:1,maxpreload:5,defaultminline:1,domain:"cnmanhua.com",comic_size:"-mht.middle",default_price:0,price:0,time_diff:37232112573};
复制代码

  1. var mh_info =
  2. {
  3.         imgpath:"L-:N-M>-A>-A?-M?-I8-J<-M@-@J-@L-M?-IA-JA-M>-@J-@>-M=-@@-@>-M?-@A-@@-:N9-M@-IN-AL-:N",
  4.         startimg:1,
  5.         totalimg:13,
  6.         mhid:"doupocangqiong",
  7.         mhname:"斗破苍穹",
  8.         pageid:1400558,
  9.         pagename:"第1话 陨落的天才(上)",
  10.         pageurl:"dpcq_1h",
  11.         readmode:1,
  12.         maxpreload:5,
  13.         defaultminline:1,
  14.         domain:"cnmanhua.com",
  15.         comic_size:"-mht.middle",
  16.         default_price:0,
  17.         price:0,
  18.         time_diff:37232112573
  19. };
复制代码
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-3-29 14:47

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表