鱼C论坛

 找回密码
 立即注册
查看: 2185|回复: 1

求教为什么运行没结果了....

[复制链接]
发表于 2017-5-9 15:21:21 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
#-*- coding:utf-8 -*-
import jieba
import xlrd
import csv
import re
import codecs
import chardet
import sys

reload(sys)
sys.setdefaultencoding('utf-8')

data = xlrd.open_workbook('H:\cheat_infos.xls') #打开需要进行分词的xls文件
table = data.sheets()[0]  #打开第一张表
nrows = table .nrows  #读取表行数
Result=[]  #建立存储分词的列表
str5=[]

for i in range(nrows):
    if i == 0:   #跳过第一行
        continue
    table.row_values(i)[4]=table.row_values(i)[4].decode('utf-8')
    table.row_values(i)[4]=''.join(table.row_values(i)[4].split())  #去除原文本中的空格
    punct=codecs.open(r'H:\puntuation.txt','rb')
    puntuation=list()
    for line in punct:
        word=line.strip("\r\n")
        word=word.decode('utf-8')
        puntuation.append(word)     #把文件内给出的标点和停止符加入列表中
    str1=''.decode('utf-8')
    for token in table.row_values(i)[4]:    #去除文本内的标点和停止符
        if token in pontuation:
            continue
        else:
            str1=str1+token
    str5.append(str1)        #把去除标点和停止符的文本写入列表str5中
  

print("标点停止符清除完成")


for j in range(len(str5[j])):  #分词,并将分词结果存入Rs列表中
    PRE =[]
    seg_list = jieba.cut(str5[j])
    for w in seg_list:
        PRE.append(w)
    Result.append(PRE)

fp_w=open(r'H:\result.csv','wb')
writer = csv.writer(fp_w)
writer.writerows(Result)
fp_w.close()



#一开始我只写了分词,此时运行正常,但发现各类无意义的符号很影响结果就决定把文本中的符号去掉,然后就写了第一段程序,然后就没法运行了...
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2017-5-9 15:31:04 | 显示全部楼层
运行不报错,但也不出结果
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-10-8 00:35

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表