我认为可以将“一年中的某一天”视为多元回归的响应变量。为了处理湖泊从不结冰的年份,我会简单地认为结冰日期大于可观察到的下限,例如,对应于冰含量开始融化(或完全融化,如果你想非常保守)。理论上它应该在那之后冻结,或者之后可以冻结,但我们不知道。这样,您可以使用您在不同参数上收集的数据来了解冻结日如何取决于它们,如果允许它晚于最新的可观察日期。然后您可以使用Tobit 模型同时处理冻结天数(对应于“正常”数据点)和下限(对应于限制,因此是审查回归)。
为了在分析中正确包含测量的下限,您可以使用删失回归模型,其中因变量在下限值处具有截止值。上述Tobit模型适用于这种情况;它假设存在一个不可观察的(潜在的)因变量,在我们的例子中,如果冬季无限期延长,它对应于冻结日期。的情况下,可观察的因变量(即在冻结日期上测量的下限)被视为等于潜变量,否则等于下限y∗iyiLi
yi={y∗iLiif∃¯Li(i.e.y∗i<Li)ify∗i≥Li
应用 Tobit 模型来处理逐个观察的删失,得到如下形式的对数似然函数
L=∑i∈y∗i<Liln[ϕ(yi−Xijβjσ)/σ]+∑i∈y∗i≥Liln[Φ(Li−Xijβjσ)]
其中和分别表示标准正态分布的概率和累积密度函数。索引运行在观察值上,运行在自变量上。线性回归的解决方案是最大化对数似然函数的参数集(包括截距)。ϕ(.)Φ(.)ijβj