[已解决]单个正则，怎么合并srt字幕里的多行字幕(可能有1/2/...n行)为1行？

blackantt · 发表于 2022-4-11 17:49:28

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

本帖最后由 blackantt 于 2022-4-12 09:40 编辑

怎么合并srt字幕里的多行(行数不定)为1行？如下，粗体行行数不定，最终想合成1行

10302
07:49:42,412 --> 07:49:45,874
you guys don't have to take
care of trina anymore tonight.

10303
07:49:45,916 --> 07:49:47,208
yeah, you do.

10304

%s/^M//g
%s/\(,\d\d\d\n.*\)\n\(.\+\)/\1 \2/g 只能2行合成1行，不定行数该咋搞呢？
%s/\(,\d\d\d\n.*\)\n\(.\+\)/\1 \2/g 如果还有2行的，再重复执行一下

或者用以下

ggvGJ 合并所有行
%s/\(\d\{1,100000\}\) \(\d\d:\d\d:\d\d,\d\d\d --> \d\d:\d\d:\d\d,\d\d\d\)/\r\r\1\r\2\r/g
删除第一行的空行

最佳答案

月排行榜 / 总排行榜

阿奇_o

2022-4-11 19:23:04

本帖最后由阿奇_o 于 2022-4-11 19:25 编辑

正则我是暂时写不出来的，给个看起来有点繁琐的办法吧，

""" 注：以下代码，只适合各段字幕都以空行作为分隔 """
with open('zimu.txt', encoding='GB2312') as f:
lines = f.readlines()
# print(lines)
# print(lines.index('\n'))
tmp = lines[:] + ['\n'] # 复制一份（且保证最后一行为空行）
t = tmp.count('\n') # 空行数
for i in range(t):
empty_pos = tmp.index('\n')
# print(empty_pos)
# group = tmp[ : empty_pos ]
# print(tmp[empty_pos-3].strip().isdigit())
# 单行字幕的情况
if tmp[empty_pos-3].strip().isdigit():
group = tmp[:empty_pos]
# print(group)
tmp = tmp[empty_pos+1:]
print('各段字幕：\n', ''.join(group)+'\n')
else:
# 双行字幕的情况
group = tmp[:empty_pos-2] + [''.join(tmp[empty_pos-2:empty_pos]).replace('\n', ' ')]
# print(group)
tmp = tmp[empty_pos+1:]
print('各段字幕：\n', ''.join(group)+'\n')

复制代码

跳转到最佳答案楼层

blackantt · 发表于 2022-4-11 18:09:18

本帖最后由 blackantt 于 2022-4-11 19:03 编辑

%s/\(,\d\d\d\n.*\)\n\(.\+\)/\1\2/g 只能2行合成1行，不定行数该咋搞呢？

阿奇_o · 发表于 2022-4-11 19:23:04

本帖最后由阿奇_o 于 2022-4-11 19:25 编辑

正则我是暂时写不出来的，给个看起来有点繁琐的办法吧，

""" 注：以下代码，只适合各段字幕都以空行作为分隔 """
with open('zimu.txt', encoding='GB2312') as f:
lines = f.readlines()
# print(lines)
# print(lines.index('\n'))
tmp = lines[:] + ['\n'] # 复制一份（且保证最后一行为空行）
t = tmp.count('\n') # 空行数
for i in range(t):
empty_pos = tmp.index('\n')
# print(empty_pos)
# group = tmp[ : empty_pos ]
# print(tmp[empty_pos-3].strip().isdigit())
# 单行字幕的情况
if tmp[empty_pos-3].strip().isdigit():
group = tmp[:empty_pos]
# print(group)
tmp = tmp[empty_pos+1:]
print('各段字幕：\n', ''.join(group)+'\n')
else:
# 双行字幕的情况
group = tmp[:empty_pos-2] + [''.join(tmp[empty_pos-2:empty_pos]).replace('\n', ' ')]
# print(group)
tmp = tmp[empty_pos+1:]
print('各段字幕：\n', ''.join(group)+'\n')

复制代码

账号		自动登录	找回密码
密码			立即注册

[已解决]单个正则，怎么合并srt字幕里的多行字幕(可能有1/2/...n行)为1行？

马上注册，结交更多好友，享用更多功能^_^

浏览过的版块