|
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
有没有办法让 文字-拼音 大致对齐?
import jieba
from pypinyin import lazy_pinyin,pinyin
seg_str = "我是一个中国人。My name is Tom."
seg1 = " ".join(jieba.lcut(seg_str))
print(''.join(lazy_pinyin(seg1,1)))
print(seg1)
本帖最后由 阿奇_o 于 2022-12-9 16:42 编辑
- # "不完美的"解决办法: 根据拼音的长度来决定汉字的占用字符长度
- import re
- import jieba
- from pypinyin import lazy_pinyin, pinyin
- s = "我是一个中国人。My name is Tom."
- seg = jieba.lcut(s)
- print(seg)
- py = [''.join(lazy_pinyin(c, 1)) if re.search('[\u4e00-\u9fa5]', c) else c for c in seg]
- print(py)
- c_len = [len(i) for i in py]
- print(' '.join(py))
- print(''.join([ h + ' '*(cl-len(h)) for h, cl in zip(seg, c_len)]))
- # "近乎完美的"解决办法: 放到"表格"里再格式化
- ...... (pandas的相关功能)
复制代码
|
|