玉树临风1935 发表于 2023-4-26 09:26:42

python操作同一个文件夹下的表格

python操作同一个文件夹下的表格,通过表格内I列身份证号,将男性识别出来,并标上蓝色,统计数量,代码如下:

import pandas as pd

# 读取 Excel 表格
df = pd.read_excel('Python测试230426jdhbdg.xlsx')

# 将身份证号转换为数字类型
df['i'] = pd.to_numeric(df['i'])

# 使用 Excel 中的条件格式将男性标记为蓝色
for i in range(len(df)):
    if df['gender'] == 'M':
      df['color'] = 'blue'

# 输出结果
print(df)

点F5运行后显示“invalid syntax”,请问各路大神,问题出在哪里?

mongoole 发表于 2023-4-26 09:33:19

无效的语法,你再仔细排查一下for循环那里。

liuhongrun2022 发表于 2023-4-26 09:38:49

试试这个呢?
import pandas as pd

# 读取 Excel 表格
df = pd.read_excel('Python测试230426jdhbdg.xlsx')

# 将身份证号转换为数字类型
df['i'] = pd.to_numeric(df['i'])

# 使用 Excel 中的条件格式将男性标记为蓝色
for i in range(len(df)):
    if df.iloc['gender'] == 'M':
      df.loc = 'blue'

# 输出结果
print(df)

玉树临风1935 发表于 2023-4-26 09:57:27

liuhongrun2022 发表于 2023-4-26 09:38
试试这个呢?

还是不行啊

liuhongrun2022 发表于 2023-4-26 10:04:22

玉树临风1935 发表于 2023-4-26 09:57
还是不行啊

报什么错

isdkz 发表于 2023-4-26 10:06:29

您的代码存在一些问题,我将为您指出并提供修复后的代码:

1. 在for循环中,您需要使用`df.loc`而不是`df['gender']`来获取单元格的值。
2. 您需要将`if df['gender'] == 'M':`更改为`if df.loc == 'M':`。
3. 您需要将`df['color'] = 'blue'`更改为`df.loc = 'blue'`。

修复后的代码如下:

import pandas as pd

# 读取 Excel 表格
df = pd.read_excel('Python测试230426jdhbdg.xlsx')

# 将身份证号转换为数字类型
df['i'] = pd.to_numeric(df['i'])

# 添加颜色列
df['color'] = ''

# 使用 Excel 中的条件格式将男性标记为蓝色
for i in range(len(df)):
    if df.loc == 'M':
      df.loc = 'blue'

# 输出结果
print(df)


但是,上述代码只是在DataFrame中设置颜色列,并不能在Excel文件中实际设置单元格颜色。如果您希望在Excel文件中将男性单元格标记为蓝色,可以使用以下代码:

import pandas as pd
from openpyxl import load_workbook
from openpyxl.styles import PatternFill

# 读取 Excel 表格
df = pd.read_excel('Python测试230426jdhbdg.xlsx')

# 将身份证号转换为数字类型
df['i'] = pd.to_numeric(df['i'])

# 统计男性数量
male_count = len(df == 'M'])

# 使用 openpyxl 设置单元格颜色
blue_fill = PatternFill(start_color='0000FF', end_color='0000FF', fill_type='solid')

wb = load_workbook('Python测试230426jdhbdg.xlsx')
ws = wb.active

# 遍历工作表,将男性标记为蓝色
for row in ws.iter_rows(min_row=2, max_row=ws.max_row):
    if row.column - 1].value == 'M':
      row.column - 1].fill = blue_fill

# 保存修改后的工作簿
wb.save('Python测试230426jdhbdg_modified.xlsx')

print(f"男性数量: {male_count}")


此代码将使用`openpyxl`库操作Excel文件并设置单元格颜色。最后,会将修改后的工作簿保存为名为`Python测试230426jdhbdg_modified.xlsx`的新文件。

玉树临风1935 发表于 2023-4-26 10:13:53

isdkz 发表于 2023-4-26 10:06
您的代码存在一些问题,我将为您指出并提供修复后的代码:

1. 在for循环中,您需要使用`df.loc`而不是`d ...

大神能不能留个QQ号

isdkz 发表于 2023-4-26 10:29:01

玉树临风1935 发表于 2023-4-26 10:13
大神能不能留个QQ号

1713925910

陶远航 发表于 2023-4-29 17:08:36

本帖最后由 陶远航 于 2023-5-21 16:29 编辑

在df['gender'] == 'M'这行代码中,缺少对某一行的引用,应该修改为 df.loc == 'M'。因此,正确的代码应该如下:

import pandas as pd

读取 Excel 表格
df = pd.read_excel('Python测试230426jdhbdg.xlsx')

将身份证号转换为数字类型
df['i'] = pd.to_numeric(df['i'])

使用 Excel 中的条件格式将男性标记为蓝色
for i in range(len(df)):
if df.loc == 'M':
df.loc = 'blue'

输出结果
print(df)

页: [1]
查看完整版本: python操作同一个文件夹下的表格