python操作同一个文件夹下的表格
python操作同一个文件夹下的表格,通过表格内I列身份证号,将男性识别出来,并标上蓝色,统计数量,代码如下:import pandas as pd
# 读取 Excel 表格
df = pd.read_excel('Python测试230426jdhbdg.xlsx')
# 将身份证号转换为数字类型
df['i'] = pd.to_numeric(df['i'])
# 使用 Excel 中的条件格式将男性标记为蓝色
for i in range(len(df)):
if df['gender'] == 'M':
df['color'] = 'blue'
# 输出结果
print(df)
点F5运行后显示“invalid syntax”,请问各路大神,问题出在哪里?
无效的语法,你再仔细排查一下for循环那里。 试试这个呢?
import pandas as pd
# 读取 Excel 表格
df = pd.read_excel('Python测试230426jdhbdg.xlsx')
# 将身份证号转换为数字类型
df['i'] = pd.to_numeric(df['i'])
# 使用 Excel 中的条件格式将男性标记为蓝色
for i in range(len(df)):
if df.iloc['gender'] == 'M':
df.loc = 'blue'
# 输出结果
print(df)
liuhongrun2022 发表于 2023-4-26 09:38
试试这个呢?
还是不行啊 玉树临风1935 发表于 2023-4-26 09:57
还是不行啊
报什么错 您的代码存在一些问题,我将为您指出并提供修复后的代码:
1. 在for循环中,您需要使用`df.loc`而不是`df['gender']`来获取单元格的值。
2. 您需要将`if df['gender'] == 'M':`更改为`if df.loc == 'M':`。
3. 您需要将`df['color'] = 'blue'`更改为`df.loc = 'blue'`。
修复后的代码如下:
import pandas as pd
# 读取 Excel 表格
df = pd.read_excel('Python测试230426jdhbdg.xlsx')
# 将身份证号转换为数字类型
df['i'] = pd.to_numeric(df['i'])
# 添加颜色列
df['color'] = ''
# 使用 Excel 中的条件格式将男性标记为蓝色
for i in range(len(df)):
if df.loc == 'M':
df.loc = 'blue'
# 输出结果
print(df)
但是,上述代码只是在DataFrame中设置颜色列,并不能在Excel文件中实际设置单元格颜色。如果您希望在Excel文件中将男性单元格标记为蓝色,可以使用以下代码:
import pandas as pd
from openpyxl import load_workbook
from openpyxl.styles import PatternFill
# 读取 Excel 表格
df = pd.read_excel('Python测试230426jdhbdg.xlsx')
# 将身份证号转换为数字类型
df['i'] = pd.to_numeric(df['i'])
# 统计男性数量
male_count = len(df == 'M'])
# 使用 openpyxl 设置单元格颜色
blue_fill = PatternFill(start_color='0000FF', end_color='0000FF', fill_type='solid')
wb = load_workbook('Python测试230426jdhbdg.xlsx')
ws = wb.active
# 遍历工作表,将男性标记为蓝色
for row in ws.iter_rows(min_row=2, max_row=ws.max_row):
if row.column - 1].value == 'M':
row.column - 1].fill = blue_fill
# 保存修改后的工作簿
wb.save('Python测试230426jdhbdg_modified.xlsx')
print(f"男性数量: {male_count}")
此代码将使用`openpyxl`库操作Excel文件并设置单元格颜色。最后,会将修改后的工作簿保存为名为`Python测试230426jdhbdg_modified.xlsx`的新文件。 isdkz 发表于 2023-4-26 10:06
您的代码存在一些问题,我将为您指出并提供修复后的代码:
1. 在for循环中,您需要使用`df.loc`而不是`d ...
大神能不能留个QQ号 玉树临风1935 发表于 2023-4-26 10:13
大神能不能留个QQ号
1713925910 本帖最后由 陶远航 于 2023-5-21 16:29 编辑
在df['gender'] == 'M'这行代码中,缺少对某一行的引用,应该修改为 df.loc == 'M'。因此,正确的代码应该如下:
import pandas as pd
读取 Excel 表格
df = pd.read_excel('Python测试230426jdhbdg.xlsx')
将身份证号转换为数字类型
df['i'] = pd.to_numeric(df['i'])
使用 Excel 中的条件格式将男性标记为蓝色
for i in range(len(df)):
if df.loc == 'M':
df.loc = 'blue'
输出结果
print(df)
页:
[1]