鱼C论坛

 找回密码
 立即注册
查看: 4017|回复: 2

敏感词过滤程序,求解

[复制链接]
发表于 2022-11-7 17:39:22 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
    1.完成一个敏感词过滤程序,分别输入待过滤的文件名与保存过
滤结果的文件名,将待过滤文件中单独的敏感词转换为等长度
的“*”字符。
    2.设待过滤文件和敏感词均为纯英文文本文件,需要过滤的敏感
词存放在文本文件“sensitivetxt”中,每行一个敏感词。
   3. 所谓单独的敏感词指的是单词前后可以有标点符号和空格,但
是不能有字母,另外,待过滤的敏感词并不区分大小写。
(运用正则表达式)
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2022-11-8 17:19:24 | 显示全部楼层
  1. import re

  2. def foo(obj_file_path, new_file_path, key_file_path='sensitive.txt'):
  3.     with open(obj_file_path, 'r', encoding='utf-8') as of:
  4.         text = of.read()

  5.     with open(key_file_path, 'r', encoding='utf-8') as kf:
  6.         keywords = kf.readlines()

  7.     for keyword in keywords:
  8.         keyword = keyword.strip()
  9.         all_kws = re.findall(keyword, text, flags=re.IGNORECASE)
  10.         if all_kws:
  11.             for kw in all_kws:
  12.                 text = text.replace(kw, '*' * len(kw))

  13.     with open(new_file_path, 'w', encoding='utf-8') as nf:
  14.         nf.write(text)

  15. if __name__ == '__main__':
  16.     ofp = 'obj.txt'
  17.     nfp = 'new.txt'
  18.     kfp = 'sensitive.txt'
  19.     foo(ofp, nfp, kfp)
复制代码
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2022-11-9 14:03:30 | 显示全部楼层

多谢大神指点,谢谢谢谢,明白了
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-4-25 18:27

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表