我认为可以将“一年中的某天”视为对多元回归的响应变量。为了处理湖泊从未结冰的年份,我只考虑冻结的天数大于可观察到的下限,例如,对应于冰含量开始融化(或完全融化)的那一天。非常保守)。从理论上讲,它应该在那之后冻结,或者在那之后可以冻结,但是我们不知道。这样,如果允许的冻结日期晚于最新的可观察日期,则可以使用在不同参数上收集的数据来了解冻结日期如何依赖于冻结日期。然后,您可以使用Tobit模型同时处理冻结天数(对应于“正常”数据点)和下限(对应于极限,并因此进行删失回归)。
为了在分析中正确包含测得的下限,您可以使用审查的回归模型,在该模型中,因变量在下限值处具有截止值。上述Tobit模型适用于这种情况;它假设存在一个不可观察的(潜在的)因变量,在我们的情况下,如果冬天无限期延长,则它对应于冻结日期。然后,在没有下限的情况下,可观察到的因变量(即测得的冻结日期下限)等于潜变量,否则等于下限。y∗iyiLi
yi={y∗iLiif∃¯Li(i.e.y∗i<Li)ify∗i≥Li
Tobit模型在处理逐观察检查中的应用产生了以下形式的对数似然函数
L=∑i∈y∗i<Liln[ϕ(yi−Xijβjσ)/σ]+∑i∈y∗i≥Liln[Φ(Li−Xijβjσ)]
其中和分别表示标准正态分布的概率函数和累积密度函数。索引基于观测值,针对自变量。线性回归的解决方案是最大化对数似然函数的参数(包括截距)的集合。Φ (。)我Ĵ β Ĵϕ(.)Φ(.)ijβj