gzj137070928 发表于 2020-11-9 17:56:35

jieba中文库

# jieba库
# 分词原理:利用一个中文词库,确定汉子之间的关联概率
# 汉字间概率大的组成词组,形成分词结果
# 用户还可以添加自定义的词组
# 三种模式:精确模式、全模式、搜索引擎模式
import jieba

str_1 = jieba.lcut("中华人民共和国是一个伟大的国家")
str_2 = jieba.lcut("中华人民共和国是一个伟大的国家", cut_all=True)
str_3 = jieba.lcut_for_search("中华人民共和国是一个伟大的国家")
print("精确模式:", str_1)
print("全模式:", str_2)
print("搜索引擎模式:", str_3)
jieba.add_word("蟒蛇语言")
页: [1]
查看完整版本: jieba中文库