随着时间的推移纳入更详细的解释变量


9

我试图了解如何最好地建模一个变量,随着时间的推移,我已经获得了越来越详细的预测变量。例如,考虑对拖欠贷款的回收率建模。假设我们有一个包含20年数据的数据集,并且在那15年中,我们仅知道贷款是否已抵押,而对于抵押的特征一无所知。但是,在过去的五年中,我们可以将抵押品划分为一系列类别,这些类别可以很好地预测回收率。

给定此设置后,我要使模型适合数据,确定度量标准,例如预测变量的统计显着性,然后使用模型进行预测。

这适合什么缺失的数据框架?是否有与以下事实相关的特殊考虑:更详细的解释变量仅在给定的时间点之后才可用,而不是分散在整个历史样本中?

Answers:


1

好的,根据使用历史数据的经验,更多的历史记录可能会使回归拟合看起来更好,但是如果预测是练习的重点,则应警告一般的答案。在数据反映“世界”非常不同的时期的情况下,相关性的稳定性值得怀疑。这在市场和法规不断发展的经济学中尤其如此。

这也适用于房地产市场,此外,房地产市场的周期可能较长。例如,抵押贷款支持证券的发明改变了抵押贷款市场,为抵押贷款的产生打开了闸门,而且不幸的是,投机活动(实际上有一类全无/低证件贷款,称为“里尔贷款”)。

测试政权变化的方法在以非主观的方式决定何时排除历史时尤其有价值。


1

通常,这可以看作是有界参数值问题。据我所知,您的数据早期具有较少的信息量(质量[Cu]未知的抵押品),而具有较高的信息([Ch],中等[Cm]或[Cl]质量低的抵押品)以后的数据。

如果您认为模型的非观测参数不会随时间变化,则该方法可能很简单,其中假设每个点的估计值均为Cl <Cm <Ch和Cl <= Cu <= Ch。逻辑是Cl是最差的,而Ch是最好的,因此,当数据未知时,它必须介于或等于这些值。如果您愿意稍作限制,并假设在最初的15年中并非所有抵押品的质量都是高品质或低品质,则可以假设Cl <Cu <Ch,这使得估计起来非常简单。

从数学,可以用以下类似的方式估算这些值:

C=经验值β1个C=经验值β1个+经验值β2Cü=经验值β1个+经验值β31个+经验值-β4CH=经验值β1个+经验值β2+经验值β3

Cu中的logit函数将值限制在Cl和Ch之间,而不限制其相对于Cm。(也可以使用范围在0和1之间的其他函数。)

该模型的另一个区别是,应该对方差进行结构化,以使剩余方差取决于时间段,因为每个时间段内的信息都不同。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.