我有两列,[Date Activated] 和 [Date Closed]。一列是帐户的激活日期,另一列是帐户关闭的日期。
有以下三种情况:
案例 1(1/6 数据)关闭账户:账户有激活和关闭日期
- 将产生一个值
案例 2(1/6 数据)活跃账户:账户有激活日期,但没有关闭日期
- 将导致 NaT,因此必须进行估算。
案例 3(数据的 2/3) 从未激活帐户:既没有激活日期也没有关闭日期的帐户。
- 将导致 NaT,因此必须进行估算
对于案例 2,我应该只取这些活动帐户的当前日期和激活日期之间的差异吗?
对于案例 3,我应该用什么来估算 NaT 值?数据没有丢失,只是没有日期,因为它从未被激活,因此从未关闭。用 0 来填充它听起来像是会丢弃在同一天和几天内激活和关闭的帐户的数据。