鱼C论坛

 找回密码
 立即注册
查看: 4266|回复: 5

写入文件替换与换行求助

[复制链接]
发表于 2015-8-21 23:05:26 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
我从落网爬下的内容:比如:来自城市与村庄的年轻人们<br>\n散落在这里的大街小巷<br>\n他们以为这里会有答案<br>\n但是时间流啊流<br>\n答案依然在风中飘荡<br>\n依然像僵硬的的表情一样迷茫<br>\n依然。。。。。。

我在写入前用了 :
print(content.count("\<br\>\\n"))
content.replace("<br>\n","#")
用#做标签后面做换行
然后居然显示0
写入文件后依然有<br>\n

请问这两个问题如何解决?
1:除去<br>\n
2:在这个地方写入文件时换行写入

谢谢各位!

小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2015-8-21 23:20:18 | 显示全部楼层
本帖最后由 ~风介~ 于 2015-8-30 23:56 编辑
  1. 代码是这样的,刚学Python,见笑了:

  2. import urllib.request
  3. import re
  4. import time

  5. def openurl(urls):   
  6.     htmls=[]
  7.     for url in urls:
  8.         req=urllib.request.Request(url)
  9.         req.add_header('User-Agent','Mozilla/5.0 (Windows NT 6.1; WOW64; rv:40.0) Gecko/20100101 Firefox/40.0')
  10.         response = urllib.request.urlopen(url)
  11.         htmls.append(response.read())
  12.         time.sleep(5)
  13.     return htmls

  14. def jiexi(htmls):
  15.     pics=[]
  16.     titles=[]
  17.     contents=[]
  18.     for html in htmls:
  19.         html = html.decode('utf-8')
  20.         pics.append(re.findall('<div class="player-wrapper".*?>.*?<img.*?src="(.*?).jp.*?".*?alt=".*"',html,re.S))
  21.         titles.append(re.findall('class="vol-title">(.*?)</span>',html,re.S))
  22.         contents.append(re.findall('<div.*?class="vol-desc">.*?(.*?)</div>',html,re.S))
  23.         
  24.     i = len(titles)
  25.     with open('C:\\Users\\Administrator\\Desktop\\test.txt', 'w') as f:
  26.         for x in range(i):
  27.             print("正在下载期刊:%d" %(746-x))
  28.             f.write("期刊名:"+str(titles[x])[2:-2]+"\n")
  29.             f.write("图片链接:"+str(pics[x])[2:-2]+".jpg\n")
  30.             content = str(contents[x])[4:-2]
  31.             content.strip
  32.             print(content.count("\<br\>\\n"))
  33.             content.replace("<br>\n","#")
  34.             f.write("配诗:"+content+"\n\n\n")


  35. yur='http://www.luoo.net/music/'
  36. urls = []
  37. for i in range(647,649):
  38.     urls.append(yur + str(i))

  39. htmls = openurl(urls)
  40. pics = jiexi(htmls)
复制代码

评分

参与人数 1荣誉 +10 鱼币 +10 贡献 +5 收起 理由
~风介~ + 10 + 10 + 5 热爱鱼C^_^

查看全部评分

小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2015-8-30 23:58:18 | 显示全部楼层
自己解决了 —— 这就是所谓的求人不如求己吧~赞一个!
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

匿名鱼油  发表于 2015-10-23 09:35:41
cfMQh6 http://www.FyLitCl7Pf7kjQdDUOLQOuaxTXbj5iNG.com
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具

发表于 2015-12-13 22:11:50 | 显示全部楼层
~风介~ 发表于 2015-8-30 23:58
自己解决了 —— 这就是所谓的求人不如求己吧~赞一个!

楼主刁刁哒!还是靠自己比较靠谱
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2016-5-22 15:07:04 | 显示全部楼层
楼主的精神值得学习
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2026-2-17 07:15

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表