我有一些从XLS文件导入的数据,该文件有2列包含字符串格式的时间信息。例:04:15:45(意思是4小时15分45秒)。
接下来我将其转换为数据时间
df['column'] = pd.to_datetime(df['column'], errors='coerce')
我得到了这样的2019-01-09 04:15:45
,这不是我想要的,但没关系(我宁愿用格式%H%M%S)。我用另一个具有相同特征的专栏做同样的事情。接下来,我创建一个新列,其中包含它们之间的差异:
df['new column'] = df['column1'] - df['column2']
但是,当我尝试将两者相减时,我得到的结果如下:-1天23:00:00
,而我真正想要的是00:16:12
,只包含%H%M%S中的差值。
从算法上讲,期望的结果是:
(time planned) - (time it actually took) = (difference format 00:18:12)
您可以在几秒钟内将输出转换为差值。
df = pd.DataFrame({'t1': ['1:13:14', '2:34:56', '2:44:32'], 't2': ['1:15:00', '2:37:00', '3:00:00']})
df.t1 = pd.to_timedelta(df.t1)
df.t2 = pd.to_timedelta(df.t2)
df
t1 t2
0 1:13:14 1:15:00
1 2:34:56 2:37:00
2 2:44:32 3:00:00
df['t_diff'] = (df.t1 - df.t2).dt.total_seconds()
t1 t2 t_diff
0 01:13:14 01:15:00 -106.0
1 02:34:56 02:37:00 -124.0
2 02:44:32 03:00:00 -928.0