鱼C论坛

 找回密码
 立即注册
查看: 1943|回复: 2

[已解决]关于Python爬虫保存问题求助

[复制链接]
发表于 2017-11-6 14:38:04 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
本帖最后由 wongyusing 于 2017-11-6 14:49 编辑
  1. import re
  2. import os
  3. from urllib import request
  4. import urllib


  5. def url_open(url):     #打开网页函数
  6.     req = urllib.request.Request
  7.     req.add_header("Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/62.0.3202.75 Safari/537.36")
  8.     response = urllib.request.urlopen(url)
  9.     html = response.read()

  10.     return html


  11. def chapter(url):


  12.     html = request.url_open(url).read().decode('gbk')

  13. #print(html)

  14.     reg =r'<li><a href="/cang/(.*?)">.*?</a>'#章节列表和章节url

  15.     txt_chapter = re.findall(reg,html)
  16.     #print(txt)
  17.     txt_num = len(txt_chapter)
  18.     return (txt_num)

  19. def book_get(chapter_url):#获取小说正文函数
  20.     html = request.url_open(chapter_url).read().decode('gbk')
  21.     reg = r'<div class="nr_con">(.*?)<div class="syz">'
  22.     txtbook = re.findall(reg,html,re.S)
  23.    
  24.     return txtbook


  25. def save_txt(folder,txt_book):
  26.     pass

  27. def down_gulong(folder="txt",txt_num=14):                 #主函数
  28.     #主函数名称           文件名
  29.     os.mkdir(folder)#生成工作目录
  30.     os.chdir(folder)#改变切入工作目录
  31.     url = 'http://www.gulongwang.com/cang/'
  32.     txt_number = txt_num
  33.     for i in range(txt_num):
  34.         txt_num += i
  35.         chapter_url = "%s%s" % (url,chapter_url)#chapter是小说正文的url
  36.         txt_book = book_get(chapter_url)#提取正文
  37.         save_txt(folder,txt_book)
复制代码

#代码如上,问题是,0.我该怎么写save_txt(folder,txt_book)这个函数,该如何保存成txt文件?
                                              1.   这本小说有13章,循环是该用for 还是whlie???
#代码不知道为什么上传不了,网盘https://pan.baidu.com/s/1geLtHeF
最佳答案
2017-11-6 15:20:14
0 学习一下open函数即可
1 for 和 while 都行
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2017-11-6 14:41:01 | 显示全部楼层
如果大神看到我写错的地方,请狠狠地用红笔批我一下
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2017-11-6 15:20:14 From FishC Mobile | 显示全部楼层    本楼为最佳答案   
0 学习一下open函数即可
1 for 和 while 都行
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2026-3-3 17:33

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表