请为统计术语but之以鼻:)我在这里发现了几个与广告和点击率有关的问题。但是他们对我的等级状况的了解都没有对我有太大帮助。
还有一个相关的问题,即相同的贝叶斯模型的这些等效表示吗?,但我不确定它们是否确实存在类似问题。另一个问题是贝叶斯分层二项式模型的先验论证了有关超优先级的细节,但是我无法将其解决方案映射到我的问题上
我在网上有几个新产品的广告。我让广告投放了几天。到那时,足够多的人点击了广告,以查看哪个获得了最多的点击。在排除所有点击次数最多的广告之后,我让该广告再运行几天,以查看点击广告后实际有多少人购买。那时我知道首先投放广告是否是个好主意。
我的统计数据非常嘈杂,因为我每天只卖几件商品,所以我没有很多数据。因此,很难估计看到广告后有多少人买东西。每150次点击中只有约1次导致购买。
一般而言,我需要通过某种方式使用所有广告的全局统计信息来平滑每个广告组的统计信息,以了解是否会尽快在每个广告上赔钱。
- 如果我等到每个广告都看到足够的购买,我就会破产,因为它花费的时间太长:测试10个广告,我需要多花10倍的钱,以便每个广告的统计数据足够可靠。到那时我可能已经亏钱了。
- 如果我平均购买所有广告,那么我将无法淘汰效果不佳的广告。
我可以使用全球购买率( N $子分配的优先级吗?这意味着我为每个广告获得的数据越多,该广告获得的统计信息就越独立。如果没有人点击广告,我认为全球平均水平是合适的。
我会为此选择哪个发行版?
如果我在A上有20次点击,在B上有4次点击,该如何建模?到目前为止,我已经发现二项分布或泊松分布在这里可能有意义:
purchase_rate ~ poisson
(?)(purchase_rate | group A) ~ poisson
(仅估算A组的购买率?)
但是,接下来我该怎么做才能真正计算出purchase_rate | group A
。如何将两个发行版连接在一起以使组A(或任何其他组)有意义。
我必须先拟合模型吗?我有可用于“训练”模型的数据:
- 广告A:352次点击,5次购买
- 广告B:15次点击,0次购买
- 广告C:3519次点击,130次购买
我正在寻找一种方法来估计任何一组的概率。如果一个组只有几个数据点,那么我本质上想回落到全局平均值。我对贝叶斯统计信息有些了解,并且阅读了很多PDF,这些人描述了如何使用贝叶斯推理和共轭先验进行建模等。我认为有一种方法可以正确执行此操作,但是我无法弄清楚如何正确建模。
我会很高兴能以贝叶斯方式解决问题的提示。这将对在线查找示例产生很大帮助,我可以使用这些示例来实际实现此目标。
更新:
非常感谢您的回复。我开始对我的问题越来越了解。谢谢!让我问几个问题,看看我现在对这个问题的理解是否更好:
因此,我假设转换是作为Beta分布分布的,并且Beta分布具有两个参数和。b
所述的参数是超参数,所以它们的参数现有?因此,最终我将转化次数和点击次数设置为Beta分发的参数吗? 1
在某些时候,当我想比较不同的广告时,我会计算。如何计算该公式的每个部分?
我认为被称为Beta分布的可能性或“模式”。这就是,其中和是我的分布参数。但是这里特定的和是仅用于广告的分布参数,对吧?在这种情况下,仅是该广告获得的点击和转化次数?还是所有广告看到了多少点击/转化?
然后,我与先验相乘,即P(conversion),在我的情况下,这只是杰弗里斯先验,它是非信息性的。获取更多数据后,先前的记录会保持不变吗?
我除以,这是边际可能性,因此我计算该广告被点击的频率是多少?
在使用Jeffreys的先前知识时,我假设我从零开始,对数据一无所知。该先验称为“非信息性”。当我继续了解自己的数据时,是否要更新以前的数据?
随着点击次数和转化次数的增加,我读到必须“更新”我的发行版。这是否意味着我的分布参数已更改,或者先前的更改?点击广告X时,是否可以更新多个分发?超过一个?