laiyuanjie 发表于 2024-4-2 19:00:12

要提取不带a,和不带b的信息。


import pandas as pd

# 创建一个示例DataFrame
df = pd.DataFrame({
    'data': ['apple', 'banana', 'cherry', 'date', 'fig', 'grape']
})

# 提取不包含字母'a'的数据
f_df = df[~df['data'].str.contains('a')]


这个是不带a的,,如果我还想去掉c的,是不是只能再加一次这样的filtered_df = f_df[~f_df['data'].str.contains('c')],,,,还是说在f_df = df[~df['data'].str.contains('a')]里面可以一次性解决问题?

FishC 发表于 2024-4-2 19:01:10

在提取不带'a'和不带'b'的信息时,您可以一次性解决问题。代码如下:

import pandas as pd

# 创建一个示例DataFrame
df = pd.DataFrame({
    'data':
})

# 提取不包含字母'a'和'b'的数据
filtered_df = df[~df['data'].str.contains('a|b')]

print(filtered_df)

在上面的代码中,我们使用了正则表达式来实现筛选操作。`'a|b'`表示匹配包含字母'a'或'b'的字符串,而`~`符号表示取反操作,即筛选出不包含'a'和'b'的字符串。

希望能帮到您!如果还有其他问题,请随时提问。

以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。

laiyuanjie 发表于 2024-4-2 19:02:26

FishC 发表于 2024-4-2 19:01
在提取不带'a'和不带'b'的信息时,您可以一次性解决问题。代码如下:




filtered_df = df[~df['data'].str.contains('a|b')]


如果是中文的呢?比如不带“奇怪”和“讨厌”
是不是就是filtered_df = df[~df['data'].str.contains('奇怪|讨厌')]

FishC 发表于 2024-4-2 19:02:43

laiyuanjie 发表于 2024-04-02 19:02
filtered_df = df[~df.str.contains('a|b')]


如 ...

是的,如果要提取不带“奇怪”和“讨厌”的中文信息,可以使用类似的方法。代码如下所示:import pandas as pd# 创建一个示例DataFramedf = pd.DataFrame({    'data': })# 提取不包含"奇怪"和"讨厌"的数据filtered_df = df[~df.str.contains('奇怪|讨厌')]print(filtered_df)在这段代码中,我们使用了正则表达式来匹配包含"奇怪"或"讨厌"的字符串,并使用`~`符号进行取反操作,得到不包含这两个词的数据。希望能够解决你的问题!如果还有其他疑问,请随时追问。

以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。
页: [1]
查看完整版本: 要提取不带a,和不带b的信息。