[已解决]分词后的汉字怎么才能跟拼音大致对齐？

blackantt · 发表于 2022-12-9 11:25:12

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

有没有办法让文字-拼音大致对齐？
有没有办法让文字-拼音大致对齐？.jpg

import jieba
from pypinyin import lazy_pinyin,pinyin

seg_str = "我是一个中国人。My name is Tom."
seg1 = " ".join(jieba.lcut(seg_str))

print(''.join(lazy_pinyin(seg1,1)))
print(seg1)

最佳答案

月排行榜 / 总排行榜

阿奇_o

2022-12-9 16:40:58

本帖最后由阿奇_o 于 2022-12-9 16:42 编辑

# "不完美的"解决办法: 根据拼音的长度来决定汉字的占用字符长度
import re
import jieba
from pypinyin import lazy_pinyin, pinyin
s = "我是一个中国人。My name is Tom."
seg = jieba.lcut(s)
print(seg)
py = [''.join(lazy_pinyin(c, 1)) if re.search('[\u4e00-\u9fa5]', c) else c for c in seg]
print(py)
c_len = [len(i) for i in py]
print(' '.join(py))
print(''.join([ h + ' '*(cl-len(h)) for h, cl in zip(seg, c_len)]))
# "近乎完美的"解决办法: 放到"表格"里再格式化
...... (pandas的相关功能)

复制代码

跳转到最佳答案楼层

阿奇_o · 发表于 2022-12-9 16:40:58

本帖最后由阿奇_o 于 2022-12-9 16:42 编辑

# "不完美的"解决办法: 根据拼音的长度来决定汉字的占用字符长度
import re
import jieba
from pypinyin import lazy_pinyin, pinyin
s = "我是一个中国人。My name is Tom."
seg = jieba.lcut(s)
print(seg)
py = [''.join(lazy_pinyin(c, 1)) if re.search('[\u4e00-\u9fa5]', c) else c for c in seg]
print(py)
c_len = [len(i) for i in py]
print(' '.join(py))
print(''.join([ h + ' '*(cl-len(h)) for h, cl in zip(seg, c_len)]))
# "近乎完美的"解决办法: 放到"表格"里再格式化
...... (pandas的相关功能)

复制代码

账号		自动登录	找回密码
密码			立即注册

[已解决]分词后的汉字 怎么才能 跟拼音 大致对齐？

马上注册，结交更多好友，享用更多功能^_^

浏览过的版块

[已解决]分词后的汉字怎么才能跟拼音大致对齐？