鱼C论坛

 找回密码
 立即注册
查看: 1097|回复: 2

python程序运行正常但是最后输出的文件是空的

[复制链接]
发表于 2018-5-9 16:47:30 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
程序目的是对文本内容进行分词、过滤停用词

文件f4,也就是过滤完停用词的最后结果为空,求大神告知是为什么?


#删除原文档中空白行
f1=open('C:\\Users\\pc\\Desktop\\source.txt','a+')
with open('C:\\Users\\pc\\Desktop\\女装评论测试集2.txt','rb')as f:

    lines=f.readlines()
   
    for line in lines:

        data=line.strip()
        
        if len(data)!=0:
           
        
            f1.write(data.decode('gbk'))
            
            f1.write('\n')
            
    f1.close
count=len(open('C:\\Users\\pc\\Desktop\\source.txt','rU').readlines())
print('文档预处理完毕')
print('文档行数为%d'%count)


#文本分词
import jieba

f2=open('C:\\Users\\pc\\Desktop\\try.txt','a+')
with open('C:\\Users\\pc\\Desktop\\source.txt','rb')as f1:

    segs=jieba.cut(f1.read())
    result=' '.join(segs)
    f2.write(result)
    f2.close()

print('分词完毕')


#导入停用词表
with open('C:\\Users\\pc\\Desktop\\stop_words.txt','rb')as f3:
    stopwords=f3.read()
stop_list=stopwords.splitlines()#转换为列表


#过滤停用词
f4= open('C:\\Users\\pc\\Desktop\\delstopword.txt','a+')
with open('C:\\Users\\pc\\Desktop\\try.txt','r')as f2:
    wordlist=[]
   
    for line in f2.readline():
        
        for word in line:
            if word not in stop_list:
                if len(word)>1:
                    wordlist.append(word)

                    
    for everyword in wordlist:
        f4.write(everyword+'\n')

f4.close()
print('停用词过滤完毕')
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2018-5-9 17:22:02 | 显示全部楼层
求大神帮忙看看,如果需要什么其他条件可以告诉我
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-5-9 18:01:10 | 显示全部楼层
过来学习一下,每天进点一占,听懂了二本玒
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-12-30 02:33

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表