鱼C论坛

 找回密码
 立即注册
查看: 1735|回复: 7

[已解决]以空行为分隔符分割文本

[复制链接]
发表于 2023-6-7 17:03:21 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
一个文本由多段文字组成,每段文本之间以一个空行分段,如何在Python以空行为分割符分割文本呢?
类似如下文本:

12345678
qwe .... rtyuio
yijouop[op

4567890-
#$%^ghj
一二三,../  四 ghj     op

后即可  uijoo
2345678
uiopp  pp
[{}  :":';'

最佳答案
2023-6-7 18:02:45
对于这个问题,你可以使用Python的 split 方法和正则表达式。这里是一个例子:
text = """
12345678
qwe .... rtyuio
yijouop[op

4567890-
#$%^ghj
一二三,../  四 ghj     op

后即可  uijoo
2345678
uiopp  pp
[{}  :":';'
"""

# 分割文本
segments = text.split('\n\n')

# 打印结果
for i, segment in enumerate(segments):
    print(f"Segment {i+1}:\n{segment}\n")
在这个例子中,我们将文本按照'\n\n'(代表空行)进行了分割,然后打印出了分割后的每一段。你会发现,每一段都是原来文本中空行之间的内容。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2023-6-7 17:10:04 | 显示全部楼层

回帖奖励 +3 鱼币

?什么意思?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2023-6-7 17:13:22 | 显示全部楼层
看懂了,每三行分隔一次吗?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2023-6-7 17:38:43 | 显示全部楼层
生成一个列表,每一段文本为一个列表元素。总的来说就是想知道有没有办法可以以空行为分割符分割文本。
https://www.jiyik.com/tm/xwzj/prolan_1403.html 这个链接文章说用split("\n\n")但是不对。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2023-6-7 17:46:45 | 显示全部楼层

回帖奖励 +3 鱼币

先占楼
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2023-6-7 18:02:45 | 显示全部楼层    本楼为最佳答案   
对于这个问题,你可以使用Python的 split 方法和正则表达式。这里是一个例子:
text = """
12345678
qwe .... rtyuio
yijouop[op

4567890-
#$%^ghj
一二三,../  四 ghj     op

后即可  uijoo
2345678
uiopp  pp
[{}  :":';'
"""

# 分割文本
segments = text.split('\n\n')

# 打印结果
for i, segment in enumerate(segments):
    print(f"Segment {i+1}:\n{segment}\n")
在这个例子中,我们将文本按照'\n\n'(代表空行)进行了分割,然后打印出了分割后的每一段。你会发现,每一段都是原来文本中空行之间的内容。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2023-6-7 18:05:38 | 显示全部楼层
可以使用以下代码将文本以空行分割成多个段落:
# 读入文本
with open('filename.txt', 'r') as f:
    text = f.read()

# 以空行分割文本
paragraphs = text.split('\n\n')

其中 `split()` 方法可以接收一个参数,该参数为要用来切割字符串的分割符。在这里我们使用两个连续的换行符 `\n\n` 作为分割符,这样就可以将文本按照空行进行分割了。分割后得到的每个元素即为一个段落,保存在列表 `paragraphs` 中。

需要注意的是,在 Windows 平台上,换行符通常是 `\r\n` 而不是单独的 `\n`,因此如果文本采用的是 Windows 的格式,那么需要将分割符改为两个连续的换行符 `\r\n\r\n`。

给个最佳答案
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2023-6-7 18:46:28 | 显示全部楼层
c
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-9-22 21:18

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表