pandas ±£ÁôÊý¾Ý,Python½»Á÷,±à³ÌÓïÑÔ×¨Çø,ÓãCÂÛÌ³

wp231957 ·¢±íÓÚ 2024-11-15 14:58:26

FishC ·¢±íÓÚ 2024-11-15 14:51
Òª¶Ô DataFrame µÄÁÐ½øÐÐÉýÐòºÍ½µÐòÅÅÐò²¢»ñÈ¡Á½¸öÐÂ DataFrame£¬Äã¿ÉÒÔÊ¹ÓÃ Pandas µÄ `sort_values`...

ÏÖÔÚµÄÐèÇóÐÞÕýÎª

import pandas as pd

df = pd.read_excel('5.xlsx',header=None)
# ¶ÔÓÚÉýÐòÅÅÐò
df1 = df.sort_values(by=0, ascending=True).reset_index(drop=True)

# ¶ÔÓÚ½µÐòÅÅÐò
df2 = df.sort_values(by=0, ascending=False).reset_index(drop=True)
outls=[]
outls.append(df1µÄ1--3,df2µÄ1--3)
outls.append(df1µÄ4--6,df2µÄ4--6)
outls.append(df1µÄ7--9,df2µÄ7--9)
.......
.......
.......
×Ü¹²×·¼Ó42´Î ½áÊø

FishC ·¢±íÓÚ 2024-11-15 14:58:38

wp231957 ·¢±íÓÚ 2024-11-15 14:58
ÏÖÔÚµÄÐèÇóÐÞÕýÎª

import pandas as pd

df = p ...

ÒªÊµÏÖÕâ¸ö¹¦ÄÜ£¬Äã¿ÉÒÔ´´½¨Ò»¸öÐÂµÄÁÐ±í `outls`£¬È»ºó°´ÕÕÐèÇó´ÓÁ½¸öÅÅÐòºóµÄ DataFrame ÖÐÌáÈ¡ÌØ¶¨µÄÐÐ½øÐÐ×·¼Ó¡£ÒÔÏÂÊÇÊµÏÖ´úÂë£º

import pandas as pd

# ¶ÁÈ¡ Excel ÎÄ¼þ
df = pd.read_excel('5.xlsx', header=None)

# ÉýÐòÅÅÐò
df1 = df.sort_values(by=0, ascending=True).reset_index(drop=True)

# ½µÐòÅÅÐò
df2 = df.sort_values(by=0, ascending=False).reset_index(drop=True)

# ³õÊ¼»¯Ò»¸ö¿ÕÁÐ±íÀ´´æ´¢½á¹û
outls = []

# °´ÕÕÐèÇó´Ó df1 ºÍ df2 ÖÐÌáÈ¡²¢×éºÏÊý¾Ý£¬¹² 42 ´Î
for i in range(42):
# ¼ÆËãÃ¿´ÎµÄÆðÊ¼Ë÷Òý
start_idx = i * 3
# ´Ó df1 ºÍ df2 ÖÐÌáÈ¡1-3ÐÐ¡¢4-6ÐÐµÈ
group = pd.concat(, df2.iloc])
# ½«½á¹û×éºÏ×ªÎªÁÐ±í²¢¼ÓÈëµ½ outls
outls.append(group)

# Êä³ö½á¹û
for idx, group in enumerate(outls, start=1):
print(f"Group {idx}:\n{group}\n")

ËµÃ÷£º
- Ê¹ÓÃ `pd.concat` À´ºÏ²¢´Ó `df1` ºÍ `df2` ÖÐÌáÈ¡µÄ×Ó DataFrame¡£
- `iloc` ÓÃÓÚ×Ó¼¯Ñ¡È¡£¬È·±£Ã¿´ÎÌáÈ¡ÈýÐÐ¡£
- Í¨¹ýÑ»·½øÐÐ¶à´ÎºÏ²¢£¬°Ñ½á¹û¼ÓÈë `outls`¡£

ÒÔÉÏ»Ø¸´À´×Ô FishC AI Ð¡ÖúÀí£¬ÈçÎ´ÄÜÕýÈ·½â´ðÄúµÄÎÊÌâ£¬Çë¼ÌÐø×·ÎÊ¡£

wp231957 ·¢±íÓÚ 2024-11-15 15:05:06

FishC ·¢±íÓÚ 2024-11-15 14:58
ÒªÊµÏÖÕâ¸ö¹¦ÄÜ£¬Äã¿ÉÒÔ´´½¨Ò»¸öÐÂµÄÁÐ±í `outls`£¬È»ºó°´ÕÕÐèÇó´ÓÁ½¸öÅÅÐòºóµÄ DataFrame ÖÐÌáÈ¡ÌØ¶¨ ...

Èç¹ûÎÒÖ»ÏëÒªÊý¾ÝÄØ ²»ÏëÒª×é(group)
group = pd.concat(, df2.iloc])
# ½«½á¹û×éºÏ×ªÎªÁÐ±í²¢¼ÓÈëµ½ outls
outls.append(group)
½á¹ûÖÐ ²»Ïë°üº¬index Ò²²»Ïë°üº¬×Ö¶ÎÃû

FishC ·¢±íÓÚ 2024-11-15 15:05:16

wp231957 ·¢±íÓÚ 2024-11-15 15:05
Èç¹ûÎÒÖ»ÏëÒªÊý¾ÝÄØ ²»ÏëÒª×é(group)
group = p ...

Èç¹ûÄãÖ»ÏëÒªÊý¾Ý£¬¶ø²»ÐèÒªË÷Òý»ò×Ö¶ÎÃû£¬¿ÉÒÔÔÚ½«Êý¾ÝÌí¼Óµ½ `outls` Ç°£¬½«Æä×ª»»Îª NumPy Êý×é»òÖ±½ÓÌáÈ¡Öµ¡£ÕâÑù»áÈ¥µô DataFrame µÄË÷ÒýºÍÁÐÃû¡£ÏÂÃæÊÇÈçºÎÊµÏÖµÄ£º

import pandas as pd

# ¶ÁÈ¡ Excel ÎÄ¼þ
df = pd.read_excel('5.xlsx', header=None)

# ÉýÐòÅÅÐò
df1 = df.sort_values(by=0, ascending=True).reset_index(drop=True)

# ½µÐòÅÅÐò
df2 = df.sort_values(by=0, ascending=False).reset_index(drop=True)

# ³õÊ¼»¯Ò»¸ö¿ÕÁÐ±íÀ´´æ´¢½á¹û
outls = []

# °´ÕÕÐèÇó´Ó df1 ºÍ df2 ÖÐÌáÈ¡²¢×éºÏÊý¾Ý£¬¹² 42 ´Î
for i in range(42):
# ¼ÆËãÃ¿´ÎµÄÆðÊ¼Ë÷Òý
start_idx = i * 3
# ´Ó df1 ºÍ df2 ÖÐÌáÈ¡1-3ÐÐ¡¢4-6ÐÐµÈ£¬²¢»ñÈ¡´¿Êý¾Ý
group_data = pd.concat(, df2.iloc]).values
# Ö±½Ó½« NumPy Êý×éÌí¼Óµ½ÁÐ±íÖÐ
outls.append(group_data)

# Êä³ö½á¹û
for idx, group_data in enumerate(outls, start=1):
print(f"Data {idx}:\n{group_data}\n")

ËµÃ÷£º
- `.iloc` ÌáÈ¡ÌØ¶¨µÄÐÐ¡£
- `.values` ½« DataFrame ×ª»»Îª NumPy Êý×é£¬È¥³ýÊý¾ÝµÄË÷ÒýºÍÁÐÃû¡£
- ½á¹ûÖÐµÄÃ¿¸ö `group_data` ÊÇÒ»¸ö¶þÎ¬µÄ NumPy Êý×é£¬½ö°üº¬Êý¾Ý±¾Éí¡£

ÒÔÉÏ»Ø¸´À´×Ô FishC AI Ð¡ÖúÀí£¬ÈçÎ´ÄÜÕýÈ·½â´ðÄúµÄÎÊÌâ£¬Çë¼ÌÐø×·ÎÊ¡£

wp231957 ·¢±íÓÚ 2024-11-15 15:10:36

FishC ·¢±íÓÚ 2024-11-15 15:05
Èç¹ûÄãÖ»ÏëÒªÊý¾Ý£¬¶ø²»ÐèÒªË÷Òý»ò×Ö¶ÎÃû£¬¿ÉÒÔÔÚ½«Êý¾ÝÌí¼Óµ½ `outls` Ç°£¬½«Æä×ª»»Îª NumPy Êý×é»òÖ± ...

dtype=object), array ÕâÐ©¶«Î÷ Ò²²»ÏëÒªÄØ
Ö»ÊÇµ¥´¿µÄÊý¾Ý Ã¿6¸öÊý¾Ý¹¹³ÉÒ»¸öÔª×é 42¸öÔª×é ¹¹³ÉÒ»¸öÁÐ±í¼´×îÖÕ½á¹û

FishC ·¢±íÓÚ 2024-11-15 15:10:45

wp231957 ·¢±íÓÚ 2024-11-15 15:10
dtype=object), array ÕâÐ©¶«Î÷ Ò²²»ÏëÒªÄØ
Ö»ÊÇ ...

ºÃµÄ£¬ÄãÏ£ÍûÃ¿6¸öÊý¾Ý¹¹³ÉÒ»¸öÔª×é£¬È»ºóÕâÐ©Ôª×é¹¹³ÉÒ»¸öÁÐ±í¡£ÕâÑù´¦ÀíÊ±£¬¿ÉÒÔÊ¹ÓÃ `.tolist()` ·½·¨½«Ã¿¸ö NumPy Êý×é×ª»»³É´¿ Python Êý¾Ý¡£ÒÔÏÂÊÇÊµÏÖ´úÂë£º

import pandas as pd

# ¶ÁÈ¡ Excel ÎÄ¼þ
df = pd.read_excel('5.xlsx', header=None)

# ÉýÐòÅÅÐò
df1 = df.sort_values(by=0, ascending=True).reset_index(drop=True)

# ½µÐòÅÅÐò
df2 = df.sort_values(by=0, ascending=False).reset_index(drop=True)

# ³õÊ¼»¯Ò»¸ö¿ÕÁÐ±íÀ´´æ´¢½á¹û
outls = []

# °´ÕÕÐèÇó´Ó df1 ºÍ df2 ÖÐÌáÈ¡²¢×éºÏÊý¾Ý£¬¹² 42 ´Î
for i in range(42):
# ¼ÆËãÃ¿´ÎµÄÆðÊ¼Ë÷Òý
start_idx = i * 3
# ´Ó df1 ºÍ df2 ÖÐÌáÈ¡1-3ÐÐ¡¢4-6ÐÐµÈ£¬²¢Éú³ÉÔª×é
group_tuple = tuple(df1.iloc.tolist() + df2.iloc.tolist())
# Ìí¼ÓÔª×éµ½ÁÐ±í
outls.append(group_tuple)

# Êä³ö½á¹û
print(outls)

ËµÃ÷£º
- `df1.iloc.tolist()` ÌáÈ¡ DataFrame ÁÐÖÐµÄÇ°3ÐÐ²¢½«Æä×ªÎªÁÐ±í¡£
- `+` ÔËËã·ûÓÃÓÚºÏ²¢Á½¸öÁÐ±í¡£
- `tuple()` ½«ºÏ²¢ºóµÄÁÐ±í×ª»»ÎªÔª×é¡£
- `outls` ÊÇÒ»¸ö°üº¬42¸öÔª×éµÄÁÐ±í£¬Ã¿¸öÔª×éÓÉ6¸öÊý¾Ý×é³É¡£

ÒÔÉÏ»Ø¸´À´×Ô FishC AI Ð¡ÖúÀí£¬ÈçÎ´ÄÜÕýÈ·½â´ðÄúµÄÎÊÌâ£¬Çë¼ÌÐø×·ÎÊ¡£

wp231957 ·¢±íÓÚ 2024-11-18 12:48:30

FishC ·¢±íÓÚ 2024-11-15 15:10
ºÃµÄ£¬ÄãÏ£ÍûÃ¿6¸öÊý¾Ý¹¹³ÉÒ»¸öÔª×é£¬È»ºóÕâÐ©Ôª×é¹¹³ÉÒ»¸öÁÐ±í¡£ÕâÑù´¦ÀíÊ±£¬¿ÉÒÔÊ¹ÓÃ `.tolist()` ·½ ...

>>> df
      ¿Í»§µ¥ºÅ    ¿Í»§·¢»õÊ±¼ä                               ÊÕ»õµØÖ· ×Ü¼þÊý ÖØÁ¿(T) Ìå»ý
0 80037236992024-09-22                ¹ã¶«Ê¡·ðÉ½ÊÐ¸ßÃ÷Çø¸üºÏÕòºÏÌÁÂ·184ºÅ 80.0 2.000 4.00
1 80037237052024-09-23                            Öì´å´óµÀÖÐ491ºÅ 80.0 2.000 4.00
2 80037237102024-09-23                   ¹ã¶«Ê¡»ÝÖÝÊÐ²©ÂÞÏØÂéÚéÕò´óÂíÂ·80ºÅ 80.0 0.100 4.00
3 80037237102024-09-23                   ¹ã¶«Ê¡»ÝÖÝÊÐ²©ÂÞÏØÂéÚéÕò´óÂíÂ·80ºÅ 80.0 0.100 4.00
4 80037262752024-09-22                ¹ã¶«Ê¡¹ãÖÝÊÐÄÏÉ³ÇøéºËÕò´óÛê´å¹¤ÒµBÇø200.0 5.00010.00
5 80037262792024-09-22                   ¹ã¶«Ê¡·ðÉ½ÊÐ¸ßÃ÷Çø¸üºÏÕò½ðÌÚÂ·1ºÅ 80.0 2.000 4.00
6 80037277272024-09-26                ¹ã¶«Ê¡»ÝÖÝÊÐ»ÝÑôÇø´óÑÇÍå°ÄÍ·ÜõÍå×ÛºÏ¸ÛÇø400.010.00020.00
7 80037440092024-09-19                   ¹ã¶«Ê¡¹ãÖÝÊÐ°×ÔÆÇøÑ»¸Ú½ðÉ³Î§Â·11ºÅ 25.0 0.500 1.00
8 80037440102024-09-20             ¹ã¶«Ê¡¶«Ý¸ÊÐÂéÓ¿ÕòÂéÓ¿ÕòÐÂÉ³¹¤ÒµÇøº£Á¦ËÇÁÏ³§150.0 3.000 6.00
9 80037440102024-09-20             ¹ã¶«Ê¡¶«Ý¸ÊÐÂéÓ¿ÕòÂéÓ¿ÕòÐÂÉ³¹¤ÒµÇøº£Á¦ËÇÁÏ³§150.0 0.100 6.00
1080037462322024-09-23                   ¹ã¶«Ê¡·ðÉ½ÊÐ¸ßÃ÷ÇøºÉ³Ç½ÖµÀÈýÖÞÐËÊ¢Â·200.0 5.00010.00
1180037476132024-09-20                ¹ã¶«Ê¡·ðÉ½ÊÐ¸ßÃ÷Çø¸üºÏÕòºÏÌÁÂ·184ºÅ408.0 0.01020.40
1280037461132024-09-22                ¹ã¶«Ê¡¹ãÖÝÊÐÄÏÉ³ÇøéºËÕò´óÛê´å¹¤ÒµBÇø400.010.00020.00
1380037476112024-09-20                   ¹ã¶«Ê¡½ÃÅÊÐ¿ªÆ½ÊÐ½ð¼¦ÕòÎÄÀÖ½Ö1ºÅ320.0 8.00016.00
1480037476122024-09-20                ¹ã¶«Ê¡·ðÉ½ÊÐ¸ßÃ÷Çø¸üºÏÕòºÏÌÁÂ·184ºÅ 32.0 0.800 1.60
1580037475902024-09-21                   ¹ã¶«Ê¡ÔÆ¸¡ÊÐÐÂÐËÏØ³µ¸ÚÕò¹¤Òµ¿ª·¢Çø100.0 2.000 4.00
1680037462332024-09-20                ¹ã¶«Ê¡¹ãÖÝÊÐ»ÆÆÒÇøºáÉ³°×½Ö172ºÅ101·¿ 50.0 1.000 2.00
1780037464322024-09-23¹ã¶«Ê¡½ÃÅÊÐÅî½Çø¶ÅÈîÕòâù¾°´óµÀÕñÁÖËÇÁÏÓÐÏÞ¹«Ë¾ ½ÃÅ Guangdong160.0 4.000 8.00
1880037482352024-09-22             ¹ã¶«Ê¡ÔÆ¸¡ÊÐÐÂÐËÏØ¶«³ÉÕòÊ®Àï¹¤ÒµÇøÁªÓªËÇÁÏ³§800.020.00040.00
1980037482422024-09-22                   ¹ã¶«Ê¡ÔÆ¸¡ÊÐÓôÄÏÏØ´óÍåÕòÐ¡ÇÅÍ·¹¤ÒµÇø720.018.00036.00
2080037482402024-09-22                   ¹ã¶«Ê¡ÔÆ¸¡ÊÐÐÂÐËÏØ³µ¸ÚÕò¹¤Òµ¿ª·¢Çø200.0 5.00010.00
2180037482382024-09-22                      ¹ã¶«Ê¡ÔÆ¸¡ÊÐÐÂÐËÏØÀÕÖñÕòé¸ù400.010.00020.00
2280037482362024-09-22       ¹ã¶«Ê¡·ðÉ½ÊÐ¸ßÃ÷Çø¸üºÏÕò¸ßÃ÷ÎÂÊÏËÇÁÏ³§Guangdong600.015.00030.00
2380037482372024-09-22                   ¹ã¶«Ê¡ÔÆ¸¡ÊÐÐÂÐËÏØïþ´åÕò°×ÍÁ¿ª·¢Çø360.0 9.00018.00
2480037482412024-09-22                ¹ã¶«Ê¡·ðÉ½ÊÐÈýË®ÇøÄÏÉ½ÕòÁùºÍÕò³Ç¶«Â·1ºÅ640.016.00032.00

ÒÑÖªÒÔÉÏÊý¾Ý£¬ÏÖÔÚÐèÇó£º
ÒªÇó°ÑÊÕ»õµØÖ·ÖÐ°üº¬ ¶«Ý¸»òÕß»ÝÖÝ»òÕß·ðÉ½ µÄ²¢ÇÒÈÕÆÚÒ»ÖÂµÄ¼ÇÂ¼ºÏ²¢ÖØÁ¿×Ö¶ÎÇóºÍ

FishC ·¢±íÓÚ 2024-11-18 12:48:44

wp231957 ·¢±íÓÚ 2024-11-18 12:48
>>> df
¿Í»§µ¥ºÅ ¿Í»§·¢»õÊ±¼ä ...

Òª½«°üº¬ÌØ¶¨¹Ø¼ü×ÖµÄÊÕ»õµØÖ·ºÏ²¢£¬²¢¶ÔÍ¬Ò»ÌìµÄÖØÁ¿½øÐÐÇóºÍ£¬Äã¿ÉÒÔÊ¹ÓÃ Pandas µÄ `groupby` ºÍ `agg` ·½·¨¡£Ê×ÏÈ£¬ÄãÐèÒªÉ¸Ñ¡³öµØÖ·ÖÐ°üº¬¹Ø¼ü×Ö "¶«Ý¸"¡¢"»ÝÖÝ"¡¢"·ðÉ½" µÄ¼ÇÂ¼£¬È»ºó°´ÕÕÈÕÆÚ½øÐÐ·Ö×éºÍÇóºÍ¡£ÒÔÏÂÊÇÊ¾Àý´úÂë£º

import pandas as pd

# ¼ÙÉèÒÑ¶ÁÈ¡Êý¾ÝÎª df
df = pd.read_excel('5.xlsx')

# É¸Ñ¡³öµØÖ·°üº¬ "¶«Ý¸"¡¢"»ÝÖÝ" »ò "·ðÉ½" µÄ¼ÇÂ¼
keywords = ['¶«Ý¸', '»ÝÖÝ', '·ðÉ½']
filtered_df = df.str.contains('|'.join(keywords))]

# °´¿Í»§·¢»õÊ±¼ä·Ö×é£¬ÇóÖØÁ¿µÄºÍ
result_df = filtered_df.groupby('¿Í»§·¢»õÊ±¼ä', as_index=False).agg({'ÖØÁ¿(T)': 'sum'})

print(result_df)

ËµÃ÷£º
- `str.contains('|'.join(keywords))`: Ê¹ÓÃÕýÔò±í´ïÊ½½«¶à¸ö¹Ø¼ü×ÖÓÃ¡°»ò¡±Ìõ¼þÁ¬½Ó£¬É¸Ñ¡°üº¬ÕâÐ©¹Ø¼ü×ÖµÄ¼ÇÂ¼¡£
- `groupby('¿Í»§·¢»õÊ±¼ä')`: ¸ù¾ÝÈÕÆÚ½øÐÐ·Ö×é¡£
- `.agg({'ÖØÁ¿(T)': 'sum'})`: ¶ÔÃ¿¸ö·Ö×éÖÐµÄÖØÁ¿ÇóºÍ¡£
- `as_index=False`: ±£Ö¤·Ö×é×Ö¶Î×÷ÎªÆÕÍ¨ÁÐ·µ»Ø£¬¶ø²»ÊÇË÷Òý¡£

ÒÔÉÏ»Ø¸´À´×Ô FishC AI Ð¡ÖúÀí£¬ÈçÎ´ÄÜÕýÈ·½â´ðÄúµÄÎÊÌâ£¬Çë¼ÌÐø×·ÎÊ¡£

wp231957 ·¢±íÓÚ 2024-11-18 12:53:59

FishC ·¢±íÓÚ 2024-11-18 12:48
Òª½«°üº¬ÌØ¶¨¹Ø¼ü×ÖµÄÊÕ»õµØÖ·ºÏ²¢£¬²¢¶ÔÍ¬Ò»ÌìµÄÖØÁ¿½øÐÐÇóºÍ£¬Äã¿ÉÒÔÊ¹ÓÃ Pandas µÄ `groupby` ºÍ `a ...

ÆäËûµÄÊý¾ÝÒ²ÊÇÐèÒªµÄ£¬Õý³£°´ÕÕÈÕÆÚ·Ö×é È»ºó×·¼Óµ½Õâ¸ö½á¹ûµ±ÖÐ

FishC ·¢±íÓÚ 2024-11-18 12:55:17

wp231957 ·¢±íÓÚ 2024-11-18 12:53
ÆäËûµÄÊý¾ÝÒ²ÊÇÐèÒªµÄ£¬Õý³£°´ÕÕÈÕÆÚ·Ö×é È»ºó×·¼Óµ½ ...

Èç¹ûÐèÒª±£ÁôÆäËûÊý¾Ý£¬²¢°´ÕÕÈÕÆÚ·Ö×é£¬È»ºóÎªÒ»¸öº¬ÓÐÌØ¶¨µØÖ·µÄ×éºÏÊý¾Ý×·¼ÓÆäËûÊý¾Ý£¬¿ÉÒÔÍ¨¹ý Pandas µÄ `groupby` ºÍ `agg` ·½·¨À´½øÐÐ´¦Àí¡£Äã¿ÉÒÔ¶Ô·Ç¾ÛºÏ×Ö¶ÎÊ¹ÓÃ `first`£¨»òÕßÆäËûÐèÒªµÄ²Ù×÷ÀýÈç `list` µÈ£©À´±£³ÖÐÅÏ¢¡£ÒÔÏÂÊÇÒ»¸öÊµÏÖÊ¾Àý£º

import pandas as pd

# ¼ÙÉèÊý¾ÝÒÑ¶ÁÈë²¢´æÔÚÓÚ df ÖÐ
df = pd.read_excel('5.xlsx')

# É¸Ñ¡³öµØÖ·°üº¬ "¶«Ý¸"¡¢"»ÝÖÝ" »ò "·ðÉ½" µÄ¼ÇÂ¼
keywords = ['¶«Ý¸', '»ÝÖÝ', '·ðÉ½']
filtered_df = df.str.contains('|'.join(keywords))]

# »ùÓÚÈÕÆÚºÏ²¢ÐÅÏ¢
result_df = filtered_df.groupby('¿Í»§·¢»õÊ±¼ä', as_index=False).agg({
'¿Í»§µ¥ºÅ': 'first', # Èç¹ûÍ¬Ò»ÌìÓÐ¶à¸ö£¬¿ÉÒÔÓÃ 'list' À´±£ÁôËùÓÐÖµ
'ÊÕ»õµØÖ·': 'first', # ÀàËÆµØ£¬'list' ¿ÉÒÔ±£ÁôËùÓÐµØÖ·
'×Ü¼þÊý': 'sum',
'ÖØÁ¿(T)': 'sum',
'Ìå»ý': 'sum'
})

# ÈôÔÊ¼Êý¾ÝÖÐÃ»ÓÐ¹ýÂËµôµÄ£¬Ò²°´ÕÕÈÕÆÚ»ã×Ü£¬¿ÉÒÔÍ¨¹ý append µÄ·½·¨×·¼ÓÉÏ
other_records = df[~df['ÊÕ»õµØÖ·'].str.contains('|'.join(keywords))]
other_grouped = other_records.groupby('¿Í»§·¢»õÊ±¼ä', as_index=False).agg({
'¿Í»§µ¥ºÅ': 'first',
'ÊÕ»õµØÖ·': 'first',
'×Ü¼þÊý': 'sum',
'ÖØÁ¿(T)': 'sum',
'Ìå»ý': 'sum'
})

# °ÑÁ½¸ö½á¹ûºÏ²¢ÆðÀ´
final_result = pd.concat(, ignore_index=True)

print(final_result)

ËµÃ÷£º
- `groupby` ÓÃÓÚ°´ÈÕÆÚ·Ö×é¡£
- ¶ÔÓÚÏ£Íû±£³ÖÔÚ×îÖÕ½á¹ûÖÐµÄÆäËûÐÅÏ¢£¨±ÈÈç¿Í»§µ¥ºÅ¡¢ÊÕ»õµØÖ·µÈ£©£¬¿ÉÒÔÑ¡ÔñÔÚ `agg` ·½·¨ÖÐÊ¹ÓÃ `'first'`£¬¶ø¶ÔÓÚÐèÒªºÏ¼ÆµÄÊýÖµÁÐÊ¹ÓÃ `'sum'`¡£
- `pd.concat` ·½·¨½«°üº¬ÌØ¶¨µØÖ·µÄ×éºÏÊý¾ÝºÍÆäËûÊý¾ÝºÏÔÚÒ»Æð£¬ÐÎ³É×îÖÕµÄ½á¹û¡£

ÒÔÉÏ»Ø¸´À´×Ô FishC AI Ð¡ÖúÀí£¬ÈçÎ´ÄÜÕýÈ·½â´ðÄúµÄÎÊÌâ£¬Çë¼ÌÐø×·ÎÊ¡£

wp231957 ·¢±íÓÚ 2024-11-19 14:05:18

FishC ·¢±íÓÚ 2024-11-18 12:55
Èç¹ûÐèÒª±£ÁôÆäËûÊý¾Ý£¬²¢°´ÕÕÈÕÆÚ·Ö×é£¬È»ºóÎªÒ»¸öº¬ÓÐÌØ¶¨µØÖ·µÄ×éºÏÊý¾Ý×·¼ÓÆäËûÊý¾Ý£¬¿ÉÒÔÍ¨¹ý Pan ...

ÏÖÔÚÓÐÕâÑùÒ»×éÊý¾Ý
ADAKLDJ
DKJLAKSDJKA
SDJKLSAJKLAJD
SDJKLSDJDKLSA
DKLSDAJF;SASDL
AJDKL;DSAJKLAJ
DJFKLAJDFKLSA
FDSJKLFJSADLKDJFA
SDJFKLSDAJFKLSA
DJFKLSDADFJKLASDF
AJDKFJSADKFA
SDJFKSAJDFKLAS
DFJKSLAJDFKLA
DFSKALJSDFKLDFJPDFO
;SDJFJALSDKJF
ADJIIPQEURFLIAJSD'FJSADKL
QDFJALKJDFKL'Q
WEJKF

ÒªÇóÊ¹ÓÃpandas ¶ÔÃ¿Ò»ÐÐ½øÐÐµ¥¶ÀÅÅÐò

FishC ·¢±íÓÚ 2024-11-19 14:05:32

wp231957 ·¢±íÓÚ 2024-11-19 14:05
ÏÖÔÚÓÐÕâÑùÒ»×éÊý¾Ý
ADAKLDJ
DKJLAKSDJKA
SDJKLSAJ ...

¿ÉÒÔÊ¹ÓÃ Pandas µÄ `apply` ·½·¨¶Ô DataFrame µÄÃ¿Ò»ÐÐ£¨»òÕßÌØ¶¨ÁÐ£©½øÐÐ²Ù×÷¡£ÔÚÄúµÄ³¡¾°ÖÐ£¬ÐèÒª¶ÔÃ¿Ò»ÐÐµÄÊý¾Ý½øÐÐ×Ö·ûÅÅÐò¡£ÒÔÏÂÊÇÊµÏÖµÄ·½·¨£º

import pandas as pd

# ¼ÙÉèÊý¾ÝÒÑ¾ÒÔÁÐ±íÐÎÊ½´æÔÚ
data = [
"ADAKLDJ",
"DKJLAKSDJKA",
"SDJKLSAJKLAJD",
"SDJKLSDJDKLSA",
"DKLSDAJF;SASDL",
"AJDKL;DSAJKLAJ",
"DJFKLAJDFKLSA",
"FDSJKLFJSADLKDJFA",
"SDJFKLSDAJFKLSA",
"DJFKLSDADFJKLASDF",
"AJDKFJSADKFA",
"SDJFKSAJDFKLAS",
"DFJKSLAJDFKLA",
"DFSKALJSDFKLDFJPDFO",
";SDJFJALSDKJF",
"ADJIIPQEURFLIAJSD'FJSADKL",
"QDFJALKJDFKL'Q",
"WEJKF"
]

# ´´½¨ DataFrame
df = pd.DataFrame(data, columns=['Text'])

# ¶ÔÃ¿Ò»ÐÐµÄÃ¿¸ö×Ö·û´®½øÐÐÅÅÐò
df['Sorted_Text'] = df['Text'].apply(lambda x: ''.join(sorted(x)))

# Êä³ö½á¹û
print(df['Sorted_Text'])

ËµÃ÷£º
1. Ê¹ÓÃ `pd.DataFrame` ½«Êý¾Ý×ª»¯Îª DataFrame¡£
2. Ê¹ÓÃ `apply` ·½·¨¶ÔÁÐÖÐµÄÃ¿¸ö×Ö·û´®Ó¦ÓÃ `sorted` º¯Êý£¬È»ºóÓÃ `''.join()` ½«ÅÅÐòºóµÄ×Ö·ûÖØÐÂ×éºÏ³É×Ö·û´®¡£
3. ½á¹û´æ´¢ÔÚÐÂµÄÁÐ `Sorted_Text` ÖÐ¡£

ÕâÑù£¬Ã¿Ò»ÐÐµÄ×Ö·û¶¼»á±»µ¥¶ÀÅÅÐò²¢±£´æ¡£

ÒÔÉÏ»Ø¸´À´×Ô FishC AI Ð¡ÖúÀí£¬ÈçÎ´ÄÜÕýÈ·½â´ðÄúµÄÎÊÌâ£¬Çë¼ÌÐø×·ÎÊ¡£

Ò³: 1 [2]

ÓãCÂÛÌ³'s Archiver