求问下这个代码怎么写
读取家族史DEMO.csv文件,尝试使用正则表达式的方法,找出具有高血压家族史的患者编号。这里是不是不能发图片呀,我的截图不知道咋发。
可以加QQ或者微信发图 球球了 …… 老八秘制 发表于 2020-6-10 19:37
……
害 真的不知道咋写了 那个文件不截图的话也写不太清{:10_266:} 等级不够,没权限发图。
使用图床发图吧。
戳我发图 sunrise085 发表于 2020-6-10 20:01
等级不够,没权限发图。
使用图床发图吧。
戳我发图
谢谢呀 可以给一个患者的编号看看 或者,你上传到一个百度云盘,分享一下链接,我们去看看 BIO-张磊 发表于 2020-6-10 20:45
或者,你上传到一个百度云盘,分享一下链接,我们去看看
好的谢谢! 兩點零晨 发表于 2020-6-10 20:57
好的谢谢!
好像我发什么链接她都说要审核 好久都没审核过呢 兩點零晨 发表于 2020-6-10 20:57
好的谢谢!
csv文件第一行是编号,家族史
第二行是A01,其父于61岁始先后患有“食管癌”(予手术治疗)、“直肠癌伴肝转移”(予手术及介入治疗)、“膀胱癌”(予手术及化疗),具体不详,仍健在。其爷爷患有“胃癌”。其姑姑30年前患有“直肠癌”(予手术及化疗),具体不详,仍健在。否认其他家族病史
第三行A03,父母有“高血压病”,无“乙肝”病史,母亲因“肝癌”去世。4个哥哥均患有“乙肝”,大哥因“淋巴癌”去世。否认其他家族性遗传性及传染性疾病史。
... 兩點零晨 发表于 2020-6-10 21:04
csv文件第一行是编号,家族史
第二行是A01,其父于61岁始先后患有“食管癌”(予手术治疗)、“直肠癌伴 ...
所以你就是说要找到 家族史列具体内容中出现 高血压病 这四个字的患者编号? BIO-张磊 发表于 2020-6-10 21:07
所以你就是说要找到 家族史列具体内容中出现 高血压病 这四个字的患者编号?
对 就是要用正则表达式写 提取前面的编号 兩點零晨 发表于 2020-6-10 21:10
对 就是要用正则表达式写 提取前面的编号
import pandas as pd
data = pd.read_csv("DEMO.csv",encoding = "GBK",index_col = 0)
def high_blood_pressure(content):
if "高血压" in content:
return True
else:
return False
data["高血压"] = data["家族史"].apply(high_blood_pressure)
print(data)
result = data == True].index.to_list()
print(result)
我觉得没必要正则表达式啊,你看看这个行不,我根据你以有的信息制作了一份csv文件,文件内容是
编号 家族史
A01 其父于61岁始先....
A03 父母有“高血压病”..... BIO-张磊 发表于 2020-6-10 21:27
import pandas as pd
data = pd.read_csv("DEMO.csv",encoding = "GBK",index_col = 0)
谢谢 因为我们老师要求要用正则表达式
感觉你写的挺好的 本帖最后由 BIO-张磊 于 2020-6-10 22:40 编辑
兩點零晨 发表于 2020-6-10 21:40
谢谢 因为我们老师要求要用正则表达式
感觉你写的挺好的
import pandas as pd
import re
data = pd.read_csv("DEMO.csv",encoding = "GBK",index_col = 0)
def high_blood_pressure(content):
content = (u'%s'%content).encode('utf-8')
if len(re.findall(u'高血压'.encode('utf-8'),content)) > 0:
return True
else:
return False
data["高血压"] = data["家族史"].apply(high_blood_pressure)
result = data == True].index.to_list()
主要我觉得这个正则表达式真的没有必要啊 BIO-张磊 发表于 2020-6-10 22:12
import pandas as pd
import re
因为在讲正则表达式,老师估计是为了让我们做题目就硬要塞正则表达式的吧{:10_257:} 谢谢大佬啦{:10_254:} 兩點零晨 发表于 2020-6-10 22:29
因为在讲正则表达式,老师估计是为了让我们做题目就硬要塞正则表达式的吧 谢谢大佬啦{:10_254: ...
要是我这个代码,可以,请采纳噢。
我的思想就是把中文和要找的都用u转化为unicode编码 BIO-张磊 发表于 2020-6-10 22:35
要是我这个代码,可以,请采纳噢。
我的思想就是把中文和要找的都用u转化为unicode编码
好滴
页:
[1]