|
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
我有多行数据,实例如下(每一个词用一个空格隔开,以一个句号结尾):
A& # B B B .
C& # N N MM .
EE # LLLL .
我像提取有&字符的词”#“后空格小于5的一行数据;具体提取的结果是:
A& # B B B .
C& # N N MM .
我目前的代码:
import re
a = open(r"C:\Users\amgalang\Desktop\第二章\词典资源中被标注的研究词条集合 - 副本.txt", encoding="utf-8")
dict = a.readlines()
list1=[]
for i in dict:
if " " in i.split('#')[-1]:
i.count(" ")
if "&" in i.split('#')[0] and i.count(" ")<4 in i.split('#')[-1]:
print(i)
还是缺点什么,希望帮帮我 补全,谢谢噢。
- with open(r"C:\Users\amgalang\Desktop\第二章\词典资源中被标注的研究词条集合 - 副本.txt", encoding="utf-8") as f:
- s = f.read()
- result = []
- for line in s.split('\n'):
- if '&' in line:
- lh, lb = line.split('#')
- if lb.count(' ') < 5:
- result.append(line)
- print(result)
复制代码
- import re # 没有使用到,删除
- a = open(r"C:\Users\amgalang\Desktop\第二章\词典资源中被标注的研究词条集合 - 副本.txt", encoding="utf-8") # 文件没有主动关闭,可使用with打开,让系统关闭
- dict = a.readlines()
- list1=[]
- for i in dict:
- if " " in i.split('#')[-1]: # 没有意义
- i.count(" ") # 计算了数目,但没有赋值给变量,这两行没有意义。而且下一句又计算了一次。
- if "&" in i.split('#')[0] and i.count(" ")<4 in i.split('#')[-1]: # 如果变量已经固定,后续有多次调用,应避免再次index索引
- print(i)
复制代码
|
|