假设我们遇到以下问题:
预测未来3个月内最有可能停止在我们商店购物的客户。
对于每个客户,我们都知道他们开始在我们的商店购买商品的月份,此外,我们还具有每月汇总的许多行为功能。“老大”的客户已经买了五十个月了。让我们表示自客户开始通过()开始购买以来的时间。可以假设客户数量很大。如果客户停止购买三个月然后又回来,则将其视为新客户,因此一个事件(停止购买)只能发生一次。
我想到了两种解决方案:
Logistic回归 -对于每个客户和每个月(可能是最近三个月除外),我们可以说客户是否停止购买,因此我们可以对每个客户和每个月进行一次观察。我们可以将自开始以来的月数用作分类变量,以获取等效的基本危害函数。
扩展Cox模型 -也可以使用扩展Cox模型对该问题进行建模。看来这个问题更适合生存分析。
问题:在类似问题中进行生存分析有哪些优势?生存分析是出于某种原因而发明的,因此必须具有一定的优势。
我对生存分析的知识不是很深,我认为使用逻辑回归也可以实现Cox模型的大多数潜在优势。
- 可以使用和分层变量的相互作用获得等效的分层Cox模型。
- 可以通过将种群分为几个亚群并为每个亚群估计LR来获得交互作用Cox模型。
我看到的唯一好处是Cox模型更加灵活。例如,我们可以轻松地计算出客户6个月后停止购买的可能性。