鱼C论坛

 找回密码
 立即注册
查看: 1669|回复: 2

[已解决]每次调用jieba,都会有"building...loading...loading“, 这个正常吗?

[复制链接]
发表于 2023-6-15 09:17:59 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
1个程序里,每次调用jieba,都会有"building...loading...loading“, 这个正常吗?

能否 building 1次?然后缓存,以后就只输出就行

jieba-bug.png
最佳答案
2023-6-15 09:36:04
"jieba" 是一个非常流行的中文分词库。在你的程序里,每次调用 "jieba" 时,都会出现 "building...loading...loading",这是因为 "jieba" 正在加载其所需的分词词典。

如果你在一个程序中多次使用 "jieba",理论上 "jieba" 只需要加载一次词典。你可以尝试把 "jieba" 的初始化放在你程序的全局环境中,然后在需要的地方调用它。这样一来,就只需要加载一次词典了。请参阅以下的代码示例:
import jieba

# 全局变量
jieba_instance = jieba.Tokenizer()

def cut_text(text):
    # 使用已经加载好的 jieba 实例
    return jieba_instance.lcut(text)

在这个示例中,"jieba" 的实例被初始化为全局变量 "jieba_instance"。每次需要分词时,你可以调用  cut_text  函数,而不是每次都新建一个 "jieba" 实例。这样,"jieba" 的分词词典就只需要在程序启动时加载一次。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2023-6-15 09:36:04 | 显示全部楼层    本楼为最佳答案   
"jieba" 是一个非常流行的中文分词库。在你的程序里,每次调用 "jieba" 时,都会出现 "building...loading...loading",这是因为 "jieba" 正在加载其所需的分词词典。

如果你在一个程序中多次使用 "jieba",理论上 "jieba" 只需要加载一次词典。你可以尝试把 "jieba" 的初始化放在你程序的全局环境中,然后在需要的地方调用它。这样一来,就只需要加载一次词典了。请参阅以下的代码示例:
import jieba

# 全局变量
jieba_instance = jieba.Tokenizer()

def cut_text(text):
    # 使用已经加载好的 jieba 实例
    return jieba_instance.lcut(text)

在这个示例中,"jieba" 的实例被初始化为全局变量 "jieba_instance"。每次需要分词时,你可以调用  cut_text  函数,而不是每次都新建一个 "jieba" 实例。这样,"jieba" 的分词词典就只需要在程序启动时加载一次。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2023-6-15 15:46:22 | 显示全部楼层
自己留念下。

把程序转为包时, 不能只在第1行加个 def.  需要把原来的import 等语句写在 def 之上。 否则就可能出现 以上现象

import pinyin_jyutping
p = pinyin_jyutping.PinyinJyutping()
pass

转为包,应该是
import pinyin_jyutping
p = pinyin_jyutping.PinyinJyutping()
def a():
   pass
   return b

不应该是

def a():
   import pinyin_jyutping
   p = pinyin_jyutping.PinyinJyutping()
   pass
   return b
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-9-22 19:31

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表