对使用pandas建立的表中数据替换问题
本帖最后由 Astray.R 于 2022-5-18 17:44 编辑import pandas as pd
a = {'name':['张三jjjj','李四123','王五','孙悟空!!!']}
df = pd.DataFrame(a)
df
有办法一次把里面名字中的英文,数字,还有!!!这些符号去掉或者替代 豆嘉木 发表于 2022-5-18 18:21
这不是用循环+条件判断不就行了,提示:每个字符串都是可迭代对象
会不会太慢?因为数据量大的话我怕会不会速度太慢,所以想看有没有更快的方法,比如假设我想创建一个合并表,这里直接
df['new'] = df['a']*2
{:10_245:} 这不是用循环+条件判断不就行了,提示:每个字符串都是可迭代对象 {:5_95:} 学习了 Astray.R 发表于 2022-5-18 18:46
会不会太慢?因为数据量大的话我怕会不会速度太慢,所以想看有没有更快的方法,比如假设我想创建一个合并 ...
这没办法啊,数据量大计算量肯定要大 import pandas as pd
a = {'name':['张三jjjj','李四123','王五','孙悟空!!!']}
df = pd.DataFrame(a)
print (list( (df["name"].str.extract(r'([\u4e00-\u9fa5]+)'))))
{:5_106:} 666666666666 本帖最后由 Astray.R 于 2022-7-17 16:40 编辑
1
页:
[1]