写入文件替换与换行求助

billiepander · 发表于 2015-8-21 23:05:26

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

我从落网爬下的内容：比如：来自城市与村庄的年轻人们<br>\n散落在这里的大街小巷<br>\n他们以为这里会有答案<br>\n但是时间流啊流<br>\n答案依然在风中飘荡<br>\n依然像僵硬的的表情一样迷茫<br>\n依然。。。。。。

我在写入前用了：
print(content.count("\<br\>\\n"))
content.replace("<br>\n","#")
用#做标签后面做换行
然后居然显示0
写入文件后依然有<br>\n

请问这两个问题如何解决？
1:除去<br>\n
2：在这个地方写入文件时换行写入

谢谢各位！

billiepander · 发表于 2015-8-21 23:20:18

本帖最后由～风介～于 2015-8-30 23:56 编辑

代码是这样的，刚学Python，见笑了：
import urllib.request
import re
import time
def openurl(urls):
htmls=[]
for url in urls:
req=urllib.request.Request(url)
req.add_header('User-Agent','Mozilla/5.0 (Windows NT 6.1; WOW64; rv:40.0) Gecko/20100101 Firefox/40.0')
response = urllib.request.urlopen(url)
htmls.append(response.read())
time.sleep(5)
return htmls
def jiexi(htmls):
pics=[]
titles=[]
contents=[]
for html in htmls:
html = html.decode('utf-8')
pics.append(re.findall('<div class="player-wrapper".*?>.*?<img.*?src="(.*?).jp.*?".*?alt=".*"',html,re.S))
titles.append(re.findall('class="vol-title">(.*?)</span>',html,re.S))
contents.append(re.findall('<div.*?class="vol-desc">.*?(.*?)</div>',html,re.S))
i = len(titles)
with open('C:\\Users\\Administrator\\Desktop\\test.txt', 'w') as f:
for x in range(i):
print("正在下载期刊：%d" %(746-x))
f.write("期刊名："+str(titles[x])[2:-2]+"\n")
f.write("图片链接："+str(pics[x])[2:-2]+".jpg\n")
content = str(contents[x])[4:-2]
content.strip
print(content.count("\<br\>\\n"))
content.replace("<br>\n","#")
f.write("配诗："+content+"\n\n\n")
yur='http://www.luoo.net/music/'
urls = []
for i in range(647,649):
urls.append(yur + str(i))
htmls = openurl(urls)
pics = jiexi(htmls)

复制代码

～风介～ · 发表于 2015-8-30 23:58:18

自己解决了 —— 这就是所谓的求人不如求己吧~

赞一个！

匿名鱼油 *发表于 2015-10-23 09:35:41* · 发表于 2015-10-23 09:35:41

cfMQh6 http://www.FyLitCl7Pf7kjQdDUOLQOuaxTXbj5iNG.com

苦哈哈哈 · 发表于 2015-12-13 22:11:50

～风介～发表于 2015-8-30 23:58
自己解决了 —— 这就是所谓的求人不如求己吧~赞一个！

楼主刁刁哒！还是靠自己比较靠谱

jroilee · 发表于 2016-5-22 15:07:04

楼主的精神值得学习

账号		自动登录	找回密码
密码			立即注册

写入文件替换与换行求助

马上注册，结交更多好友，享用更多功能^_^

评分

浏览过的版块