[已解决]pandas 系列之三

wp231957 · 发表于 2024-7-31 10:43:27

FishC 发表于 2024-7-31 10:40
哈哈，看来你的 Excel 文件在读取时进行了日期自动转换，导致日期被转换成了浮点数。Excel 中的日期实 ...

no no no  出错了
Traceback (most recent call last):
  File "d:\wp\行列转换.py", line 5, in <module>
dfa.iloc[0] = pd.to_datetime(dfa.iloc[0], unit='D', origin='1899-12-30')
  File "D:\Python39\lib\site-packages\pandas\core\tools\datetimes.py", line 1041, in to_datetime
arg = _adjust_to_origin(arg, origin, unit)
  File "D:\Python39\lib\site-packages\pandas\core\tools\datetimes.py", line 592, in _adjust_to_origin
raise ValueError(
ValueError: '0       日期
1    45413.0
2    45414.0
3    45415.0
4    45416.0
5    45417.0
6    45418.0
7    45419.0
8    45420.0
9    45421.0
10 45422.0
11 45423.0
12 45424.0
13 45425.0
Name: 0, dtype: object' is not compatible with origin='1899-12-30'; it must be numeric with a unit specified

FishC · 发表于 2024-7-31 10:43:35

wp231957 发表于 2024-07-31 10:43
no no no 出错了
Traceback (most recent call last ...

哎呀，看起来是我给的代码搞错了地方，真是不好意思！让我们回到你的问题上，从头开始处理。

如果你的 Excel 文件中的数据原本是字符串形式的日期（比如 “5月1日”），但在读取时显示为浮点数，首先确保在加载时读取为字符串格式。可以使用 `dtype=str` 来确保所有列都作为字符串读取。下面是完整的代码：

import pandas as pd
# 导入数据，强制所有列以字符串形式读取
dfa = pd.read_excel('hanglie_test.xlsx', header=None, dtype=str)
print(dfa)

复制代码

如果你已经这样做了，但数据显示仍然是浮点数，那说明数据在 Excel 中可能以浮点数的形式存储。你可以用以下方法直接将其转换成字符串：

import pandas as pd
# 导入数据，强制所有列以字符串形式读取
dfa = pd.read_excel('hanglie_test.xlsx', header=None)
# 将所有数据类型转换为字符串
dfa = dfa.astype(str)
print(dfa)

复制代码

如果原始数据中包含了类似 45413.0 的数值，并想把它们还原为表示日期的字符串形式，可以使用以下方法：

import pandas as pd
# 导入数据
dfa = pd.read_excel('hanglie_test.xlsx', header=None)
# 首先，将浮点数转换为整数，再格式化为字符串
dfa = dfa.applymap(lambda x: str(int(float(x))) if str(x).replace('.', '', 1).isdigit() else x)
# 打印结果
print(dfa)

复制代码

在这个代码段中，`applymap` 函数会遍历 DataFrame 的每个元素，如果元素是数字（浮点数），则将其转换为字符串形式的整数（即去掉小数部分），否则就不变。这样，你应该能保留原始数据的字符串形式。

再次感谢你的耐心，如果还有其他问题，请随时告诉我！

以上回复来自 FishC AI 小助理，如未能正确解答您的问题，请继续追问。

wp231957 · 发表于 2024-7-31 10:46:13

FishC 发表于 2024-7-31 10:43
哎呀，看起来是我给的代码搞错了地方，真是不好意思！让我们回到你的问题上，从头开始处理。

如果你 ...

这样不会报错，但是如何把我的日期给恢复回来呢

import pandas as pd

#导入数据
dfa = pd.read_excel('hanglie_test.xlsx',header=None,dtype=str)
dfa=dfa.T
print(dfa)

'''
      0 1 2
0    日期  最高价  最低价
1 45413  NaN  NaN
2 45414  3.6  NaN
3 45415  NaN  NaN
4 45416  NaN  NaN
5 45417  NaN  2.3
6 45418  NaN  NaN
7 45419  NaN  NaN
8 45420  NaN  NaN
9 45421  NaN  NaN
10  45422  NaN  NaN
11  45423  NaN  NaN
12  45424  NaN  NaN
13  45425  NaN  NaN
'''

FishC · 发表于 2024-7-31 10:46:21

wp231957 发表于 2024-07-31 10:46
这样不会报错，但是如何把我的日期给恢复回来呢

...

好的，看来我们需要将这些表示日期的数字（如 "45413"）转换回可读的日期格式。由于你使用的数字是 Excel 日期格式，我们可以将它们转换为标准的日期格式。

以下是一个示例代码，展示如何将读取到的数字转换为字符串形式的日期（如 "5月1日"）：

import pandas as pd
# 导入数据
dfa = pd.read_excel('hanglie_test.xlsx', header=None, dtype=str)
dfa = dfa.T
# 将数据中的数字日期转换为 datetime格式
# 注意这里的origin是Excel的日期起点
dfa[0] = pd.to_datetime(dfa[0].astype(float), unit='D', origin='1899-12-30')
# 格式化日期为“月日”形式，例如“5月1日”
dfa[0] = dfa[0].dt.strftime('%m月%d日')
# 输出结果
print(dfa)

复制代码

在这段代码中：
1. 使用 `pd.to_datetime()` 将 Excel 的日期数字转换为 Python 的日期格式。
2. 使用 `.dt.strftime('%m月%d日')` 方法将日期格式化为你希望的字符串形式（如 "5月01日"）。
3. 最后输出 `dfa`，现在第一列就应该包含你所期望的字符串日期了！

如果你还有其他问题或需要进一步调整，请随时告诉我！

以上回复来自 FishC AI 小助理，如未能正确解答您的问题，请继续追问。

wp231957 · 发表于 2024-7-31 10:53:52

FishC 发表于 2024-7-31 10:34
看起来你希望在行列转换后保留日期作为一列，并且实现三列的格式。让我们来调整一下代码！

如果你想 ...

我大约知道怎么个情况了
你告诉我如何删除df的第一行数据

FishC · 发表于 2024-7-31 10:54:02

wp231957 发表于 2024-07-31 10:53
我大约知道怎么个情况了
你告诉我如何删除df的第一行 ...

当然可以！要删除 DataFrame 的第一行数据，你可以使用 `drop()` 方法，结合行的索引来实现。下面是一个示例代码：

import pandas as pd
# 假设你已经有了一个 DataFrame dfa
dfa = pd.read_excel('hanglie_test.xlsx', header=None, dtype=str)
dfa = dfa.T
# 删除第一行数据，索引为 0
dfa = dfa.drop(index=0)
# 重置索引（可选，这样会重新生成连续的索引）
dfa = dfa.reset_index(drop=True)
# 输出结果
print(dfa)

复制代码

在这段代码中，`drop(index=0)` 表示删除索引为 0 的行，也就是第一行。然后用 `reset_index(drop=True)` 可以重置索引，使索引变得连续，不再保留原来的索引。

这样你就可以成功删除 DataFrame 的第一行数据了！如果还有其他问题，随时问我哦！

以上回复来自 FishC AI 小助理，如未能正确解答您的问题，请继续追问。

wp231957 · 发表于 2024-7-31 10:57:51

FishC 发表于 2024-7-31 10:54
当然可以！要删除 DataFrame 的第一行数据，你可以使用 `drop()` 方法，结合行的索引来实现。下面是一 ...

如何删除最高价==NAN and 最低价==NAN的所有行

FishC · 发表于 2024-7-31 10:57:59

wp231957 发表于 2024-07-31 10:57
如何删除最高价==NAN and 最低价==NAN的所有行

如果你想删除同时满足“最高价”列和“最低价”列都是 `NaN` 的所有行，可以使用 `dropna()` 方法，并指定 `subset` 参数来只考虑这两列。下面是具体的代码示例：

import pandas as pd
# 假设你已经有了一个 DataFrame dfa
dfa = pd.read_excel('hanglie_test.xlsx', header=None, dtype=str)
dfa = dfa.T
# 先命名列（假设已经明确知道第二行是列名）
dfa.columns = dfa.iloc[0] # 将第一行设置为列名
dfa = dfa[1:] # 删除第一行（列名行）
# 将 '最高价' 和 '最低价' 列转换为数值类型（如果需要）
dfa['最高价'] = pd.to_numeric(dfa['最高价'], errors='coerce')
dfa['最低价'] = pd.to_numeric(dfa['最低价'], errors='coerce')
# 删除 '最高价' 和 '最低价' 都为 NaN 的行
dfa = dfa.dropna(subset=['最高价', '最低价'], how='all')
# 输出结果
print(dfa)

复制代码

在这段代码中：
1. 我们首先将第一行设置为列名，然后去掉第一行。
2. 使用 `pd.to_numeric()` 将“最高价”和“最低价”两列转换成数值类型，这样可以正确处理 `NaN` 值。
3. `dropna(subset=['最高价', '最低价'], how='all')` 会删除同时在“最高价”和“最低价”两列中都为 `NaN` 的所有行。

这样就成功删除了所有相关的行！如果还有其他问题，请随时问我哦！

以上回复来自 FishC AI 小助理，如未能正确解答您的问题，请继续追问。

wp231957 · 发表于 2024-7-31 15:09:27

FishC 发表于 2024-7-31 10:57
如果你想删除同时满足“最高价”列和“最低价”列都是 `NaN` 的所有行，可以使用 `dropna()` 方法，并 ...

import pandas as pd

person = {"personid": [1, 2],"lastname":["张三","李四"],"firstname":["小刚","小明"]}
dfa = pd.DataFrame(person)
address = {"personid": [2, 3],"addressid":[1,2],"city":["吉林省","广东省"],"state":["长春市","东莞区"]}
dfc = pd.DataFrame(address)
'''
现在要求对两个表进行合并
合并的要求是：
1、person中有而address中没有的用nan表示
2、address中有  而person中没有的直接舍去
最后形成的表需要四个字段  分别是  lastname  firstname  city  state
'''
print("game over")

FishC · 发表于 2024-7-31 15:09:45

wp231957 发表于 2024-07-31 15:09
import pandas as pd

person = {"personid": ,"las ...

好的，我们来实现这个合并的要求！要按照你的要求合并两个 DataFrame，使用 `merge()` 函数是最合适的。具体步骤如下：

1. 在合并时使用 `how='left'`，这样可以确保 `person` 表中所有的数据都保留下来，而 `address` 表中没有匹配的会用 `NaN` 填充。
2. 使用 `on` 参数指定基于哪个字段进行合并。

下面是完整代码示例：

import pandas as pd
# 创建 person DataFrame
person = {
"personid": [1, 2, 3],
"lastname": ["Smith", "Johnson", "Williams"],
"firstname": ["John", "Robert", "David"]
}
dfa = pd.DataFrame(person)
# 创建 address DataFrame
address = {
"personid": [1, 3],
"addressid": [101, 102],
"city": ["New York", "Los Angeles"],
"state": ["NY", "CA"]
}
dfc = pd.DataFrame(address)
# 合并两个 DataFrame
merged_df = pd.merge(dfa, dfc[['personid', 'city', 'state']], on='personid', how='left')
# 选择所需的列并输出结果
final_df = merged_df[['lastname', 'firstname', 'city', 'state']]
print(final_df)
print("game over")

复制代码

在这段代码中：
- 我们创建了两个 DataFrame，`dfa` 和 `dfc`。
- 使用 `pd.merge()` 对这两个 DataFrame 进行合并，`how='left'` 确保 `person` 表中所有数据都保留，而 `address` 表中没有的用 `NaN` 填充。
- 最后，只选择需要的列（`lastname`, `firstname`, `city`, `state`）并输出结果。

这样就能得到你想要的表格。如果还有其他问题，请随时告诉我！

以上回复来自 FishC AI 小助理，如未能正确解答您的问题，请继续追问。

wp231957 · 发表于 2024-7-31 15:14:18

FishC 发表于 2024-7-31 15:09
好的，我们来实现这个合并的要求！要按照你的要求合并两个 DataFrame，使用 `merge()` 函数是最合适的 ...

我的例子举错了，是不是 state 大于 city 啊

FishC · 发表于 2024-7-31 15:14:30

wp231957 发表于 2024-07-31 15:14
我的例子举错了，是不是 state 大于 city 啊

哈哈，没关系！我们来修正一下示例，并正确地进行合并。根据你的说明，最后形成的表应该包含四个字段：`lastname`、`firstname`、`city` 和 `state`。而关于 `state` 和 `city` 之间的关系，其实合并后会根据数据来显示。

下面是一个完整的示例代码，假设我们先填充一些示例数据，然后按照你的需求进行合并：

import pandas as pd
# 创建 person DataFrame (示例数据)
person = {
"personid": [1, 2, 3],
"lastname": ["Smith", "Johnson", "Williams"],
"firstname": ["John", "Robert", "Michael"]
}
dfa = pd.DataFrame(person)
# 创建 address DataFrame (示例数据)
address = {
"personid": [1, 2],
"addressid": [101, 102],
"city": ["New York", "Los Angeles"],
"state": ["NY", "CA"]
}
dfc = pd.DataFrame(address)
# 合并两个 DataFrame
merged_df = pd.merge(dfa, dfc, on='personid', how='left')
# 选择所需的列并输出结果
final_df = merged_df[["lastname", "firstname", "city", "state"]]
print(final_df)
print("game over")

复制代码

在这个示例中：
1. 我们创建了两个 DataFrame：`dfa` 包含人员信息，`dfc` 包含地址信息。
2. 用 `pd.merge()` 合并两个 DataFrame，`how='left'` 确保 `person` 表中所有数据都被保留，`address` 表中没有的用 `NaN` 填充。
3. 最后，通过选择需要的列来创建 `final_df`，只保留 `lastname`、`firstname`、`city` 和 `state` 四个字段。

如果你希望添加条件，比如 `state` 的值大于 `city`，请具体说明如何应用这个条件，我会帮你实现它！如果还有其他问题，请随时告诉我！

以上回复来自 FishC AI 小助理，如未能正确解答您的问题，请继续追问。

wp231957 · 发表于 2024-7-31 15:15:56

FishC 发表于 2024-7-31 15:14
哈哈，没关系！我们来修正一下示例，并正确地进行合并。根据你的说明，最后形成的表应该包含四个字段： ...

merge 这东西和concat 有啥区别啊

FishC · 发表于 2024-7-31 15:16:16

wp231957 发表于 2024-07-31 15:15
merge 这东西和concat 有啥区别啊

哈哈，这是个好问题！`merge` 和 `concat` 都是 `pandas` 中用来合并数据的函数，但它们的用途和方式有些不同。我们来详细看看它们各自的特点：

### 1. `merge`
- **功能**：用于基于一个或多个键（列）将两个 DataFrame 合并在一起，类似于 SQL 中的 JOIN 操作。
- **参数**：
- `on`：指定要根据哪些列进行合并。
- `how`：合并的方式（如 'left'、'right'、'inner'、'outer'），分别为左连接、右连接、内连接和外连接。
- **结果**：返回一个新的 DataFrame，包含根据指定键合并后的数据。

import pandas as pd
# 示例
df1 = pd.DataFrame({'key': ['A', 'B', 'C'], 'value1': [1, 2, 3]})
df2 = pd.DataFrame({'key': ['B', 'C', 'D'], 'value2': [4, 5, 6]})
merged_df = pd.merge(df1, df2, on='key', how='inner')
print(merged_df)

复制代码

输出：

key value1 value2
0 B 2 4
1 C 3 5

复制代码

### 2. `concat`
- **功能**：用于沿着某一轴将多个 DataFrame 拼接在一起，可以是纵向（行）拼接或横向（列）拼接。
- **参数**：
- `axis`：指定拼接的方向，0 为纵向（行拼接），1 为横向（列拼接）。
- `ignore_index`：是否重置索引。
- **结果**：返回一个新的 DataFrame，将所有输入的 DataFrame 按照指定方向拼接在一起。

import pandas as pd
# 示例
df1 = pd.DataFrame({'A': [1, 2], 'B': [3, 4]})
df2 = pd.DataFrame({'A': [5, 6], 'B': [7, 8]})
concat_df = pd.concat([df1, df2], axis=0, ignore_index=True)
print(concat_df)

复制代码

输出：

A B
0 1 3
1 2 4
2 5 7
3 6 8

复制代码

### 总结
- 使用 **`merge`** 当你需要按特定的列来组合 DataFrame，就像 SQL 的 JOIN 操作。
- 使用 **`concat`** 当你只想简单地把多个 DataFrame 堆叠在一起，不关心键是什么的时候。

希望这个解释清楚了它们之间的区别！如果还有其他疑问，尽管问我哦！

以上回复来自 FishC AI 小助理，如未能正确解答您的问题，请继续追问。

wp231957 · 发表于 2024-7-31 15:18:56

FishC 发表于 2024-7-31 15:16
哈哈，这是个好问题！`merge` 和 `concat` 都是 `pandas` 中用来合并数据的函数，但它们的用途和方式有 ...

左连接有一点点点明白了
那么右连接、内连接和外连接这三个都是如何连接的还是他们不常用呢

FishC · 发表于 2024-7-31 15:19:18

wp231957 发表于 2024-07-31 15:18
左连接有一点点点明白了
那么右连接、内连接和外 ...

好的，让我们来详细讨论一下右连接、内连接和外连接的概念以及它们的用法！虽然左连接是最常用的，但其他连接方式也很重要，尤其是在处理数据时。下面分别解释这几种连接方式：

### 1. 右连接 (Right Join)
- **定义**：保留右侧 DataFrame 中的所有行，而左侧 DataFrame 中的匹配行会被保留下来。如果左侧 DataFrame 中没有匹配项，会在结果中填充 `NaN`。
- **示例**：

import pandas as pd
# 创建示例 DataFrame
df1 = pd.DataFrame({'key': ['A', 'B', 'C'], 'value1': [1, 2, 3]})
df2 = pd.DataFrame({'key': ['B', 'C', 'D'], 'value2': [4, 5, 6]})
# 进行右连接
merged_df = pd.merge(df1, df2, on='key', how='right')
print(merged_df)

复制代码

输出：

key value1 value2
0 B 2.0 4
1 C 3.0 5
2 D NaN 6

复制代码

### 2. 内连接 (Inner Join)
- **定义**：只保留两个 DataFrame 中都存在的匹配行。也就是说，只有在左右 DataFrame 中都存在那个 `key` 的行才会出现在结果中。
- **示例**：

import pandas as pd
# 创建示例 DataFrame
df1 = pd.DataFrame({'key': ['A', 'B', 'C'], 'value1': [1, 2, 3]})
df2 = pd.DataFrame({'key': ['B', 'C', 'D'], 'value2': [4, 5, 6]})
# 进行内连接
merged_df = pd.merge(df1, df2, on='key', how='inner')
print(merged_df)

复制代码

输出：

key value1 value2
0 B 2 4
1 C 3 5

复制代码

### 3. 外连接 (Outer Join)
- **定义**：保留两个 DataFrame 中所有的行，无论左边 DataFrame 中是否存在匹配行。如果某一方没有匹配项，会在结果中填充 `NaN`。
- **示例**：

import pandas as pd
# 创建示例 DataFrame
df1 = pd.DataFrame({'key': ['A', 'B', 'C'], 'value1': [1, 2, 3]})
df2 = pd.DataFrame({'key': ['B', 'C', 'D'], 'value2': [4, 5, 6]})
# 进行外连接
merged_df = pd.merge(df1, df2, on='key', how='outer')
print(merged_df)

复制代码

输出：

key value1 value2
0 A 1.0 NaN
1 B 2.0 4.0
2 C 3.0 5.0
3 D NaN 6.0

复制代码

### 小结
- **右连接**（`how='right'`）保留右侧 DataFrame 的所有行。
- **内连接**（`how='inner'`）只保留两个 DataFrame 中都存在的匹配行。
- **外连接**（`how='outer'`）保留两个 DataFrame 的所有行，缺失的地方用 `NaN` 填充。

这些连接在不同情况下都是非常有用的，尤其是在处理复杂的数据集时。虽然左连接可能使用得更多，但根据具体需求，其他类型的连接同样重要！

如果你还有其他疑问，欢迎继续提问哦！

以上回复来自 FishC AI 小助理，如未能正确解答您的问题，请继续追问。

wp231957 · 发表于 2024-8-1 13:41:14

FishC 发表于 2024-7-31 15:19
好的，让我们来详细讨论一下右连接、内连接和外连接的概念以及它们的用法！虽然左连接是最常用的，但其 ...

很想知道，pandas 也支持sql语法吗

FishC · 发表于 2024-8-1 13:41:32

wp231957 发表于 2024-08-01 13:41
很想知道，pandas 也支持sql语法吗

是的，`pandas` 确实支持 SQL 语法的一些操作，但并不意味着它完全实现了 SQL。`pandas` 提供的数据操作方法和 SQL 查询有许多相似之处，你可以用它来进行数据筛选、聚合、连接等操作，不过使用的是函数而不是 SQL 语句。

如果你想在 `pandas` 中使用 SQL 语法，有几个方法可以做到：

### 1. 使用 `pandasql` 库
`pandasql` 是一个允许你对 `pandas` DataFrame 使用 SQL 查询的库。通过这个工具，你可以直接写 SQL 语句来查询 DataFrame，就像在数据库中一样。安装和使用示例如下：

# 安装 pandasql
!pip install pandasql
import pandas as pd
import pandasql as psql
# 创建示例 DataFrame
df = pd.DataFrame({
'A': [1, 2, 3],
'B': ['a', 'b', 'c']
})
# 使用 SQL 查询
query = "SELECT * FROM df WHERE A > 1"
result = psql.sqldf(query)
print(result)

复制代码

### 2. 使用 `DataFrame` 方法
虽然不是 SQL 语法，但 `pandas` 提供了一系列强大的方法来执行相同的操作。比如，你可以使用 `.query()` 方法来进行条件筛选，或者使用 `.merge()` 来进行连接，类似于 SQL 中的操作。

# 创建两个示例 DataFrame
df1 = pd.DataFrame({'key': ['A', 'B', 'C'], 'value': [1, 2, 3]})
df2 = pd.DataFrame({'key': ['B', 'C', 'D'], 'value': [4, 5, 6]})
# 使用 merge 进行连接（类似于 SQL JOIN）
merged_df = pd.merge(df1, df2, on='key', how='inner')
print(merged_df)
# 使用 query 进行筛选（类似于 SQL WHERE）
filtered_df = df1.query("value > 1")
print(filtered_df)

复制代码

### 小结
虽然 `pandas` 并不原生支持 SQL 语法，但你可以使用如 `pandasql` 这样的库来执行 SQL 查询，或是通过 `pandas` 提供的方法来完成大多数 SQL 操作。使用 `pandas` 的灵活性和强大功能，可以实现很多 SQL 的效果！

如果你有兴趣了解更多关于 `pandas` 和 SQL 的结合使用，或者有其他问题，请随时告诉我！

以上回复来自 FishC AI 小助理，如未能正确解答您的问题，请继续追问。

wp231957 · 发表于 2024-8-1 13:43:45

FishC 发表于 2024-8-1 13:41
是的，`pandas` 确实支持 SQL 语法的一些操作，但并不意味着它完全实现了 SQL。`pandas` 提供的数据操 ...

如果不使用query 那么常规方法如何筛选呢
# 使用 query 进行筛选（类似于 SQL WHERE）
filtered_df = df1.query("value > 1")

FishC · 发表于 2024-8-1 13:43:59

wp231957 发表于 2024-08-01 13:43
如果不使用query 那么常规方法如何筛选呢
# 使用 qu ...

当然可以！如果不使用 `query()` 方法，你可以使用常规的 DataFrame 筛选方法来完成相同的操作。`pandas` 提供了丰富的方法来进行数据筛选，以下是几种常用的方法：

### 使用布尔索引
你可以创建一个布尔条件，然后将其用作索引来过滤 DataFrame。例如，如果我们想筛选出 `value` 列大于 1 的行，可以这样做：

import pandas as pd
# 创建示例 DataFrame
df1 = pd.DataFrame({
'key': ['A', 'B', 'C', 'D'],
'value': [1, 2, 3, 0]
})
# 使用布尔索引进行筛选
filtered_df = df1[df1['value'] > 1]
print(filtered_df)

复制代码

### 结果：

key value
1 B 2
2 C 3

复制代码

### 使用 `.loc[]`
你也可以使用 `.loc[]` 来筛选行，`.loc[]` 允许你基于标签访问数据，可以结合布尔数组来进行筛选。

# 使用 .loc[] 进行筛选
filtered_df = df1.loc[df1['value'] > 1]
print(filtered_df)

复制代码

### 使用 `.filter()` 方法
虽然不太常用于数值比较，但你可以使用 `.filter()` 方法来根据列名或行名进行筛选。

# 使用 filter() 进行列名筛选（适用于条件简单的场景）
filtered_df = df1.filter(items=['key', 'value'])
print(filtered_df)

复制代码

### 其他组合
如果你有多个条件，还可以组合布尔条件：

# 多条件筛选
filtered_df = df1[(df1['value'] > 1) & (df1['key'] != 'C')]
print(filtered_df)

复制代码

### 总结
常规方法中，布尔索引和 `.loc[]` 是非常直观且常用的筛选方法，它们能够让你在不使用 `query()` 的情况下轻松实现数据筛选。你也可以使用组合条件来更复杂地筛选数据。

如果你还有其他问题或者想了解更多的内容，请随时告诉我！

以上回复来自 FishC AI 小助理，如未能正确解答您的问题，请继续追问。

账号		自动登录	找回密码
密码			立即注册

[已解决]pandas 系列之三

浏览过的版块