最近一个开发需求中要求用pandas实现该需求:
逐行对比两列,选出每行两列中较大的值加到第三列
翻了下好像没有类似的函数,所以没办法要自己造轮子,直接上代码和注释
1
2
3
4
5
6
7
8
9
10
11
12
|
# 需要对比的值为value_x和value_y # 新家的列名为value_final # 1.设置一个flag,值为value_y-value_x,为正代表y较大,负代表x较大 df_test[ 'value_flag' ] = df_test[ 'Value_y' ] - df_test[ 'Value_x' ] # 2.分别取得y较大的部分和x较大的部分 df_test_bigger = df_test[df_test[ 'value_flag' ] > = 0 ].copy() df_test_litter = df_test[df_test[ 'value_flag' ] < 0 ].copy() # 3.分别对final进行赋值 df_test_bigger[ 'Value_Final' ] = df_test_bigger[ 'Value_y' ] df_test_litter[ 'Value_Final' ] = df_test_litter[ 'Value_x' ] # 4.使用concat函数将其聚合 df_test_1 = pd.concat([df_test_bigger, df_test_litter]) |
补充:pandas技巧--两列相加形成新一列(eval)
如下:
1
2
3
4
|
data. eval ( '新字段=字段1+字段2' ,inplace = True ) data. eval ( """新字段1=字段1+字段2 新字段2=字段1+字段2 新字段3=字段1+字段2""" ,inplace = True ) |
以上为个人经验,希望能给大家一个参考,也希望大家多多支持服务器之家。如有错误或未考虑完全的地方,望不吝赐教。
原文链接:https://blog.csdn.net/qq_38115310/article/details/100761034