Astray.R 发表于 2022-5-18 17:42:45

对使用pandas建立的表中数据替换问题

本帖最后由 Astray.R 于 2022-5-18 17:44 编辑

import pandas as pd

a = {'name':['张三jjjj','李四123','王五','孙悟空!!!']}
df = pd.DataFrame(a)
df

有办法一次把里面名字中的英文,数字,还有!!!这些符号去掉或者替代

Astray.R 发表于 2022-5-18 18:46:58

豆嘉木 发表于 2022-5-18 18:21
这不是用循环+条件判断不就行了,提示:每个字符串都是可迭代对象

会不会太慢?因为数据量大的话我怕会不会速度太慢,所以想看有没有更快的方法,比如假设我想创建一个合并表,这里直接
df['new'] = df['a']*2

{:10_245:}

豆嘉木 发表于 2022-5-18 18:21:41

这不是用循环+条件判断不就行了,提示:每个字符串都是可迭代对象

hornwong 发表于 2022-5-18 20:42:21

{:5_95:}

kerln888 发表于 2022-5-18 20:57:15

学习了

豆嘉木 发表于 2022-5-18 21:30:40

Astray.R 发表于 2022-5-18 18:46
会不会太慢?因为数据量大的话我怕会不会速度太慢,所以想看有没有更快的方法,比如假设我想创建一个合并 ...

这没办法啊,数据量大计算量肯定要大

xfmiao 发表于 2022-5-18 21:34:33

import pandas as pd

a = {'name':['张三jjjj','李四123','王五','孙悟空!!!']}
df = pd.DataFrame(a)
print (list( (df["name"].str.extract(r'([\u4e00-\u9fa5]+)'))))

hornwong 发表于 2022-5-18 23:30:55

{:5_106:}

amazed 发表于 2022-5-19 01:23:22

666666666666

Astray.R 发表于 2022-7-17 00:23:52

本帖最后由 Astray.R 于 2022-7-17 16:40 编辑

1
页: [1]
查看完整版本: 对使用pandas建立的表中数据替换问题