提问者:小点点

基于使用熊猫的条件的飞行轮班日期


我有一个如下所示的数据帧

df1 = pd.DataFrame({'person_id': [11, 21, 31, 41, 51],
                        'date_1': ['12/30/1961', '05/29/1967', '02/03/1957', '7/27/1959', '01/13/1971'],
                        'backward': [0,120,1,2,3],
                        'forward':  [0,12,1,0,0]})
df1['date_1'] = pd.to_datetime(df1['date_1'])

我想做的是

1)根据forward列的值向前移动date_1列(添加日期)。

2)如果向前列的值为0,则从向后中选取该值,并将日期向后移动(减去日期)

3)如果向前向后都是0,则由于我们添加/减去到日期为止的0天,因此对日期没有任何区别。出于编码目的,如果您仍然想知道选择哪一列,则可以考虑向后列。

这就是我试过的

df1['new_date'] = df1['date_1'].sub(pd.to_timedelta(df1['forward'],unit='d'))
df1['bool'] = df1['date_1'].eq(df1['new_date']) # i do this to find out which rows aren't changed. So I can look at backward column to subtract days for these records
df1.loc[df1.bool == True, "new_date"] = df1['date_1'].sub(pd.to_timedelta(df1['backward'],unit='d'))

我希望我的输出如下所示。 正如您在最后2行和第1行中看到的,向前列的值为0,因此我们从向后列中选取值,然后减去日期


共1个答案

匿名用户

您可以在转发时使用mask将0s替换为负向后列,然后将to_timeDelta此系列添加到日期中

df1['new_date'] = (df1['date_1'] 
                   + pd.to_timedelta(df1['forward'].mask(lambda x: x.eq(0), 
                                                         -df1['backward']), 
                                     unit='d')
                  )
print (df1)
   person_id     date_1  backward  forward   new_date
0         11 1961-12-30         0        0 1961-12-30
1         21 1967-05-29       120       12 1967-06-10
2         31 1957-02-03         1        1 1957-02-04
3         41 1959-07-27         2        0 1959-07-25
4         51 1971-01-13         3        0 1971-01-10