鱼C论坛

 找回密码
 立即注册
查看: 1865|回复: 5

怎么把分页内容合并

[复制链接]
发表于 2021-7-5 09:04:36 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
文章内页有分页,怎么把采集到的分页内容合并为一篇呢?我用的事scrapy
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2021-7-5 10:04:53 | 显示全部楼层
不大的,直接都放到 一个列表里,逐页添加进去 ls.append(page_text), 合并即 ''.join(ls)

大的,就写到磁盘文件里,如 txt文件,或 csv文件, 追加模式写入即可。

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2021-7-5 11:30:54 | 显示全部楼层
阿奇_o 发表于 2021-7-5 10:04
不大的,直接都放到 一个列表里,逐页添加进去 ls.append(page_text), 合并即 ''.join(ls)

大的,就写 ...
  1. a=[]
  2. for i in range(3):
  3.      a.append(i)
  4. print(a)
复制代码


你说的是这个样子吧。。  但是我的情况不是这样的。
我用的是scrapy  yield传出了3个url返回的数据给了另外一个函数。

另外的函数提取了我要的数据。它是依次提取的。我打印出来是单独的一个一个的列表。利用你的方法无法放到一个列表中啊。因为它不是for循环。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2021-7-5 11:35:21 | 显示全部楼层
我不是第一个 发表于 2021-7-5 11:30
你说的是这个样子吧。。  但是我的情况不是这样的。
我用的是scrapy  yield传出了3个url返回的数据 ...

我的意图就是,一篇文章有3个分页,我想提取3个分页内容,然后合并为一篇。用scrapy实现。
现在3个分页的内容已经获取到了,就是不知道怎么合并。。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2021-7-5 17:26:01 | 显示全部楼层
我不是第一个 发表于 2021-7-5 11:30
你说的是这个样子吧。。  但是我的情况不是这样的。
我用的是scrapy  yield传出了3个url返回的数据 ...
打印出来是单独的一个一个的列表...


都可以打印数据了,还不会合并? —— return ls1 + ls2 + ls3

OK?

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2021-7-5 19:45:06 | 显示全部楼层
阿奇_o 发表于 2021-7-5 17:26
都可以打印数据了,还不会合并? —— return ls1 + ls2 + ls3

OK?

都是一个函数输出的数据,也就都是ls1   加不了的。。举个例子吧!
采集这里的任意3篇文章,把它们的内容合并为一篇。。咋弄。。
http://www.zuowen.com/danyuanzw/gaozhongyuwen/rjg3s/
用scrapy 框架
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-5-14 01:58

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表