可以从概念上理解pareto / nbd模型吗?


12

我正在学习使用BTYD程序包,该程序使用Pareto / NBD模型来预测何时将有客户返回。但是,有关该模型的所有文献都充斥着数学,并且似乎没有对该模型的工作原理进行简单/概念性的解释。是否可以为非数学家理解Pareto / NBD模型?我读完了Fader的那篇著名论文。Pareto / NBD模型进行以下假设:

一世。当处于活动状态时,客户在长度为t的时间段内进行的交易数量将以交易率λ进行泊松分布。

ii。客户之间交易率的异质性遵循具有形状参数r和比例参数α的伽马分布。

iii。每个客户都有一个长度τ的不可观察的“寿命”。客户处于非活动状态的这一点以辍学率µ呈指数分布。

iv)客户之间的辍学率异质性遵循形状参数为s和比例参数为β的伽玛分布。

v。交易率λ和退出率μ随客户而独立变化。”

我不理解假设(ii),(iii)和(iv)的(直觉)原理。为什么只分配这些分布,为什么不分配其他分布?

BG / NBD模型的假设还包括:

i。)在激活时,客户进行的交易数量遵循Poisson流程,交易率为λ。这等效于假设事务之间的时间以事务速率λ呈指数分布

ii)λ中的异质性遵循伽马分布

iii)进行任何交易后,客户以概率p变得不活跃。因此,根据pmf的(移位)几何分布,客户在各个交易中分布的“退出”点

iv)p中的异质性遵循beta分布

假设(ii),(iii)和(iv)的(直观)合理性也不是很明显。

我将不胜感激。谢谢。


您能补充一些您觉得困难的文献吗?
kjetil b halvorsen

我已经详细说明了尚不清楚的地方。我知道要发挥直觉并不容易,但如果可能的话,将大有帮助。谢谢。
user3282777 '17

Answers:


14

想象你是一家花店的新任命经理。您已记录了去年的客户-他们购物的频率以及自上次访问以来的时间。您想知道所列客户今年可能带来多少业务。有几件事情要考虑:

[假设(ii)]顾客有不同的购物习惯。

有些人一直喜欢鲜花,而有些人只在特殊场合才喜欢鲜花。分配交易汇率更为,而不是假设单个解释每个人的行为。λλ

分布需要很少的参数(您不一定有很多数据),要相当灵活(您可能不是读心的企业家,也不是完全了解购物习惯),正实数中的值。Gamma分布打勾了所有这些框,并且经过了充分研究并且相对易于使用。在不同的设置中,它通常用作先验正参数。

[假设(iii)]您可能已经失去了列表中的一些客户。

如果安德里亚(Andrea)在去年的每个月大约每月购买一次鲜花,那她今年肯定会回来的。如果Ben过去每周都买花,但是几个月没来了,那么也许他找到了另一家花店。在制定未来的业务计划时,您可能希望依靠Andrea而不是Ben。

客户不会告诉您他们什么时候继续前进,这就是两种模型的“不可观察的寿命”假设所在。想象第三个客户Cary。Pareto / NBD和BG / NBD模型为您提供了两种不同的方式来思考Cary永久退出商店的情况。

对于Pareto / NBD的情况,想像一下,在任何时间点,Cary都会遇到比您更好的商店的机会很小。这种无穷无尽的无穷风险为您提供了数以千计的生命-自从卡里上次访问以来,它越长,他在其他(可能会更好)的花店工作的时间就越长。

BG / NBD案件人为的多。每次Cary到达您的商店时,他都会承诺购买一些鲜花。在浏览时,他会考虑自上次访问以来价格,质量和品种的变化,这最终将使他决定是下次再次回来还是寻找其他商店。因此,卡里(Cary)并非总是处于危险之中,而是有几率p决定在每次购买后离开。

[假设(iv)]并非所有客户都同样致力于您的商店。

有些客户是固定客户,只有死亡(或价格急剧上涨)才会迫使他们离开。其他人可能想探索,为了在街对面的新潮时髦花店而高兴地离开您。而不是为所有客户提供单一的辍学率,分配辍学率(或BG / NBD案例中的概率)更有意义。

这与购物习惯非常相似。我们追求的是一种灵活,完善的发行版,其中包含很少的参数。在帕累托/ NBD情况下,由于比率为正实数,因此我们使用Gamma 。在BG / NBD情况下,我们使用Beta,它是参数的标准先验。μ(0;1)

我希望这有帮助。如果您还没有看过原始论文(Schmittlein等,1987),那么他们会从中了解一些直觉。


感谢您的辛勤工作和清晰的解释。使用Gamma分布的原因是它相对易于使用,并且经常被用作不同设置中正参数的先验条件。虽然大多数伽玛分布的形状(具有不同的参数值)很容易理解,但是可以使“客户之间交易率的异质性”适应几乎成指数下降的伽玛分布(对于k = 1,theta = 2,如Wikipedia图[此处](en.wikipedia.org/wiki/Gamma_distribution)很难理解。我们是否排除这种行为?
user3282777 '17

1
您对Gamma参数的估计将取决于您使用的数据。整个问题在于,仅基于两个参数,Gamma分布的形状就可以显着不同,并且您可以让数据说明自己,而无需施加过于严格的假设(或多或少)。
Lyuba B.
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.