python操作同一个文件夹下的表格,Python交流,编程语言专区,鱼C论坛

玉树临风1935 发表于 2023-4-26 09:26:42

python操作同一个文件夹下的表格

python操作同一个文件夹下的表格，通过表格内I列身份证号，将男性识别出来，并标上蓝色，统计数量，代码如下：

import pandas as pd

# 读取 Excel 表格
df = pd.read_excel('Python测试230426jdhbdg.xlsx')

# 将身份证号转换为数字类型
df['i'] = pd.to_numeric(df['i'])

# 使用 Excel 中的条件格式将男性标记为蓝色
for i in range(len(df)):
if df['gender'] == 'M':
df['color'] = 'blue'

# 输出结果
print(df)

点F5运行后显示“invalid syntax”，请问各路大神，问题出在哪里？

mongoole 发表于 2023-4-26 09:33:19

无效的语法，你再仔细排查一下for循环那里。

liuhongrun2022 发表于 2023-4-26 09:38:49

试试这个呢？
import pandas as pd

# 读取 Excel 表格
df = pd.read_excel('Python测试230426jdhbdg.xlsx')

# 将身份证号转换为数字类型
df['i'] = pd.to_numeric(df['i'])

# 使用 Excel 中的条件格式将男性标记为蓝色
for i in range(len(df)):
if df.iloc['gender'] == 'M':
df.loc = 'blue'

# 输出结果
print(df)

玉树临风1935 发表于 2023-4-26 09:57:27

liuhongrun2022 发表于 2023-4-26 09:38
试试这个呢？

还是不行啊

liuhongrun2022 发表于 2023-4-26 10:04:22

玉树临风1935 发表于 2023-4-26 09:57
还是不行啊

报什么错

isdkz 发表于 2023-4-26 10:06:29

您的代码存在一些问题，我将为您指出并提供修复后的代码：

1. 在for循环中，您需要使用`df.loc`而不是`df['gender']`来获取单元格的值。
2. 您需要将`if df['gender'] == 'M':`更改为`if df.loc == 'M':`。
3. 您需要将`df['color'] = 'blue'`更改为`df.loc = 'blue'`。

修复后的代码如下：

import pandas as pd

# 读取 Excel 表格
df = pd.read_excel('Python测试230426jdhbdg.xlsx')

# 将身份证号转换为数字类型
df['i'] = pd.to_numeric(df['i'])

# 添加颜色列
df['color'] = ''

# 使用 Excel 中的条件格式将男性标记为蓝色
for i in range(len(df)):
if df.loc == 'M':
df.loc = 'blue'

# 输出结果
print(df)

但是，上述代码只是在DataFrame中设置颜色列，并不能在Excel文件中实际设置单元格颜色。如果您希望在Excel文件中将男性单元格标记为蓝色，可以使用以下代码：

import pandas as pd
from openpyxl import load_workbook
from openpyxl.styles import PatternFill

# 读取 Excel 表格
df = pd.read_excel('Python测试230426jdhbdg.xlsx')

# 将身份证号转换为数字类型
df['i'] = pd.to_numeric(df['i'])

# 统计男性数量
male_count = len(df == 'M'])

# 使用 openpyxl 设置单元格颜色
blue_fill = PatternFill(start_color='0000FF', end_color='0000FF', fill_type='solid')

wb = load_workbook('Python测试230426jdhbdg.xlsx')
ws = wb.active

# 遍历工作表，将男性标记为蓝色
for row in ws.iter_rows(min_row=2, max_row=ws.max_row):
if row.column - 1].value == 'M':
row.column - 1].fill = blue_fill

# 保存修改后的工作簿
wb.save('Python测试230426jdhbdg_modified.xlsx')

print(f"男性数量: {male_count}")

此代码将使用`openpyxl`库操作Excel文件并设置单元格颜色。最后，会将修改后的工作簿保存为名为`Python测试230426jdhbdg_modified.xlsx`的新文件。

玉树临风1935 发表于 2023-4-26 10:13:53

isdkz 发表于 2023-4-26 10:06
您的代码存在一些问题，我将为您指出并提供修复后的代码：

1. 在for循环中，您需要使用`df.loc`而不是`d ...

大神能不能留个QQ号

isdkz 发表于 2023-4-26 10:29:01

玉树临风1935 发表于 2023-4-26 10:13
大神能不能留个QQ号

1713925910

陶远航 发表于 2023-4-29 17:08:36

本帖最后由陶远航于 2023-5-21 16:29 编辑

在df['gender'] == 'M'这行代码中，缺少对某一行的引用，应该修改为 df.loc == 'M'。因此，正确的代码应该如下：

import pandas as pd

读取 Excel 表格
df = pd.read_excel('Python测试230426jdhbdg.xlsx')

将身份证号转换为数字类型
df['i'] = pd.to_numeric(df['i'])

使用 Excel 中的条件格式将男性标记为蓝色
for i in range(len(df)):
if df.loc == 'M':
df.loc = 'blue'

输出结果
print(df)

页: [1]

鱼C论坛's Archiver

python操作同一个文件夹下的表格