鱼C论坛

 找回密码
 立即注册
查看: 2680|回复: 3

使用jieba分词但报错,求帮助

[复制链接]
发表于 2019-12-13 00:13:39 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
使用jieba分词的时候出现了这一个问题该怎么破呢?

import jieba
import os

def load_data(path):
    input_file = os.path.join(path)
    with open(input_file,"r",encoding='utf-8') as f:
     data = f.read()
    return data.split('\n')

ch_sent = load_data('Chinese.txt')
seg_list = jieba.cut (ch_sent)
print(", ".join(seg_list))

Traceback (most recent call last):
  File "C:/Users/Khor Jia Cheng/Desktop/NLP/CHTRANSLATE/CHTRANSLATE.py", line 12, in <module>
    print(", ".join(seg_list))
  File "C:\Users\Khor Jia Cheng\Desktop\NLP\CHTRANSLATE\venv\lib\site-packages\jieba\__init__.py", line 282, in cut
    sentence = strdecode(sentence)
  File "C:\Users\Khor Jia Cheng\Desktop\NLP\CHTRANSLATE\venv\lib\site-packages\jieba\_compat.py", line 37, in strdecode
    sentence = sentence.decode('utf-8')
AttributeError: 'list' object has no attribute 'decode'

小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2019-12-13 08:52:58 | 显示全部楼层
提示你是列表对象,你打印下seg_list就知道了,没用过jieba,估计是嵌套列表
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2019-12-13 14:24:41 | 显示全部楼层
塔利班 发表于 2019-12-13 08:52
提示你是列表对象,你打印下seg_list就知道了,没用过jieba,估计是嵌套列表

我打印了 他出现 <generator object Tokenizer.cut at 0x000001543DB227D8>。怎么破啊
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-12-13 18:12:32 | 显示全部楼层
自己搜生成器怎么遍历
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2026-1-21 07:42

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表