作为对这个问题的部分回答,我将提出一个论点,即时间本身不能成为适当的因果变量,但使用代表特定自然状态发生的“时间”变量是合法的或存在于指定的时间段内(实际上是一个状态变量)。这些问题是问题本身的推动力,因为我的直觉告诉我,因果模型中的“时间”必须是某种状态变量的一种代理。
时间本身不能是一个因果变量
时间已经是因果概念的一个组成部分:第一个障碍是因果概念涉及动作,并且动作随着时间而发生。因此,“时间”已经融入了因果关系的概念。因此,人们可能会将其视为一个概念,其中时间作为该概念中的一个参数变量是先验的,是不可接受的。断言时间是结果的原因需要承认时间既是断言的因果变量,也是因果关系本身的必要概念。(我们将在下面看到更多的效果。)
如果时间造成任何事情,它就会导致一切:第二个障碍是因果关系通常被认为需要一个反事实条件在时间被断言为因果变量的情况下,这会变得微不足道。如果我们说“前置条件 X 导致动作 Y”,则相关的反事实条件是:(1)前置条件 X 的存在/出现意味着动作 Y 将发生;(2) 在没有其他原因的情况下,没有前提条件 X 意味着动作 Y 不会发生。但是由于“将发生”的意思是“将随着时间的推移而发生”,因此使用“时间”作为因果变量不会对第一个要求增加任何内容,而使第二个要求成为重言式。如果前置条件 X 是“时间的运动”,则(1)归约为“时间的运动意味着动作 Y 将发生”,逻辑上归结为“动作 Y 将发生”;(2) 简化为“仅随时间发生)。在因果关系的这种反事实解释下,一个动作的时间因果性的断言在逻辑上等同于一个断言该动作将会发生。因此,我们必须要么得出结论,这个条件太弱而不能构成因果关系(即时间不是任何事物的原因),要么是时间是一切事物的原因。
纯时间因果性在形而上学上等同于随机性:当我们遇到“时间”是唯一断言的因果变量的情况(即,在纯时间因果性的情况下)时,就会出现另一个障碍。问题是,如果变量随时间发生任何变化,在非时间变量没有因果关系的情况下,这传统上被认为是偶然随机性的定义——即非因果关系。因此,断言时间是结果的唯一原因就是从形而上学中完全摒弃非因果性(随机性)的概念,并用一个基本的“原因”代替它,如果没有其他原因,这个原因总是存在的。或者,人们可以合理地断言时间因果关系的主张是等价的对于随机性的断言——即,它断言除了时间的流逝之外没有任何原因导致变化。如果是这种情况,那么在 DAG 中作为因果变量的“时间”的存在等同于它的缺失(因此简约建议将其排除在外)。此外,该领域的历史建议保留现有的“随机性”术语。
将时间作为因果变量的因果演算问题:我要提到的另一个最后障碍(可能还有更多)是在因果演算中很难将“时间”作为因果变量来处理。在标准因果演算中,我们有一个运算符,它对因果变量进行操作,以反映对系统的干预,以将该变量更改为可能与被动观察下的值不同的选定值. 在不违反其他哲学或统计原则的情况下,是否可以对时间变量进行“干预”,这一点并不完全清楚。人们当然可以争辩说,等待do(⋅)是一种改变时间的干预(仅向前),但即使这样解释,它也无法与被动性区分开来,因此可以说它与被动性观察没有区别。有人可能会争辩说,我们可以在不同时间记录大量数据,然后“干预”将选择哪些时间值包含在数据中进行分析。这确实会涉及时间段的选择(在可用数据上),因此它似乎构成了一种干预,但这是一种认知干预,而不是一种形而上学的干预。(这也引起了未能使用所有可用数据的次要问题。)
随时间累积的状态变量可以是因果变量
DAG 可以包括表示在规定时间内发生的自然状态的变量:有许多合法的因果变量表示在规定时间段内某种状态或某些事件的发生。一个简单的例子(向卡洛斯致敬在下面的答案中)是随着时间的推移进行的金钱投资,这会产生利息。在这种情况下,产生利息的原因是资金是在一段时间内投资的,投资期限越长,产生的利息就越高。在这种情况下,有一个“时间”变量是合法的,它代表投资的选定时间段,并且该变量将对应计利息产生直接的因果影响。同样,一个人的“年龄”变量是一种“时间”变量(AdamO在下面的答案中),表示该人已经在指定的时间段内活着。这些变量中的每一个都是可以包含在 DAG 中的合法因果变量。这些变量并不代表时间本身的进展——它们代表了在特定时间段内存在某种自然状态的事实。在许多情况下,将这样的变量标记为“时间”是一种有用的简写,但重要的是要记住它代表一段时间内的特定状态,而不是时间本身的进展。
从某种意义上说,每个变量都属于这种类型:由于每个可能的事件或自然状态都发生在特定时间点或一段时间内,因此每个变量都涉及一些(通常是隐含的)时间规范。然而,有一些变量,例如“年龄”或“投入的时间”,它们与时间有更直接的联系,因为该变量表示获得特定状态的时间累积量。
在 DAG 中使用“时间”是随时间累积的状态变量的简写:如果上述论点是正确的,那么在 DAG 中使用“时间”变量似乎必须是表示发生的变量的简写特定事件或特定自然状态在特定时间段内的存在。时间进程本身不受控制或干预,并且由于上述原因不能成为因果变量。但是,特定自然状态在一段时间内的普遍性当然可以是一个合法的因果变量,可以包含在 DAG 中。
这些点给出了为什么使用“时间”作为因果变量是有问题的一些基本概念,以及将“时间”添加到 DAG 意味着什么。正如你所看到的,我的观点是时间本身不能是一个因果变量,但你可以有一个“时间”变量,它实际上代表一个事件或自然状态在一段时间内发生或存在。我愿意被说服相反,但在我看来,这似乎是解决这个问题的明智之举。