鱼C论坛

 找回密码
 立即注册
查看: 3511|回复: 2

敏感词过滤程序,求解

[复制链接]
发表于 2022-11-7 17:39:22 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
    1.完成一个敏感词过滤程序,分别输入待过滤的文件名与保存过
滤结果的文件名,将待过滤文件中单独的敏感词转换为等长度
的“*”字符。
    2.设待过滤文件和敏感词均为纯英文文本文件,需要过滤的敏感
词存放在文本文件“sensitivetxt”中,每行一个敏感词。
   3. 所谓单独的敏感词指的是单词前后可以有标点符号和空格,但
是不能有字母,另外,待过滤的敏感词并不区分大小写。
(运用正则表达式)
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2022-11-8 17:19:24 | 显示全部楼层
import re

def foo(obj_file_path, new_file_path, key_file_path='sensitive.txt'):
    with open(obj_file_path, 'r', encoding='utf-8') as of:
        text = of.read()

    with open(key_file_path, 'r', encoding='utf-8') as kf:
        keywords = kf.readlines()

    for keyword in keywords:
        keyword = keyword.strip()
        all_kws = re.findall(keyword, text, flags=re.IGNORECASE)
        if all_kws:
            for kw in all_kws:
                text = text.replace(kw, '*' * len(kw))

    with open(new_file_path, 'w', encoding='utf-8') as nf:
        nf.write(text)

if __name__ == '__main__':
    ofp = 'obj.txt'
    nfp = 'new.txt'
    kfp = 'sensitive.txt'
    foo(ofp, nfp, kfp)
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2022-11-9 14:03:30 | 显示全部楼层

多谢大神指点,谢谢谢谢,明白了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-11-15 12:23

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表