如何用时变偏差建模偏差硬币?


10

偏向硬币模型通常具有一个参数。从一系列平局中估计一种方法是使用Beta先验并以二项式似然计算后验分布。θθ=P(Head|θ)θ

在我的环境中,由于一些奇怪的物理过程,我的硬币特性正在缓慢变化,成为时间的函数。我的数据是一组有序抽奖,即。我可以认为我在离散且规则的时间网格上每仅获得一个抽奖。{ ħ Ť ħ ħ ħ Ť } tθt{H,T,H,H,H,T,...}t

您将如何建模?我正在考虑类似卡尔曼滤波器的事情,以适应隐藏变量为并保持二项式可能性的事实。我可以使用什么来建模P(\ theta(t + 1)| \ theta(t))以保持推理的可操纵性?P θ + 1 | θ θP(θ(t+1)|θ(t))

编辑以下答案(谢谢!):我想将\ theta(t)建模θ(t)为1级马尔可夫链,就像在HMM或Kalman滤波器中所做的那样。我可以做出的唯一假设是θ(t)是平滑的。我可以将P(θ(t+1)|θ(t))=θ(t)+ϵ\ epsilon一起写成ϵ一个小高斯噪声(卡尔曼滤波器的思想),但这会破坏\ theta的要求θ必须保留在[0,1]。遵循@J Dav的想法,我可以使用probit函数将实线映射到[0,1],但是我有直觉,这将提供非分析性的解决方案。均值\ theta(t)的 beta分布θ(t) 而更大的差异可以解决问题。

我问这个问题是因为我觉得这个问题是如此简单,以至于必须先进行研究。


如果您有一个成功率如何随时间变化的模型,则可以估算。许多不同的模型都可以工作,并且根据假定的模型,估计值可能会有很大差异。我认为易处理性不是选择模型的实用标准。我想了解该过程,并寻找一个模型来证明其特征与您期望的行为相符。
Michael R. Chernick

@MichaelChernick:谢谢。我可以做出的唯一假设是平稳且缓慢地移动。此外,易处理性是一个重要标准,因为我实际上想将解决方案扩展到具有非平凡相互依赖关系的多变量情况。理想的解决方案是分析,并在新数据到达时对参数估计值进行“在线”更新。θ
2012年

1
您能否量化“平稳缓慢地移动”的含义?整数是离散的,并且存在平滑函数,这些函数对整数取任意值,这意味着平滑度没有约束。有些“缓慢”的概念仍然没有给出任何约束,而有些则没有。θ
Douglas Zare 2012年

“缓慢”的速度有多快,例如0.1 /单位时间或0.001或0.001的概率变化?您希望序列有多长时间?范围相对较窄(例如0.2-0.4)还是接近(0,1)?
jbowman 2012年

@DouglasZare通过“平滑”,我想声明E [θ_t+ 1 |θ_t] =θ_t(或非常接近),并且VAR(θ_t+ 1 |θ_t)很小。θ不会跳跃(否则什么也做不了)。
2012年

Answers:


2

我怀疑您是否可以提出带有解析解决方案的模型,但是由于模型的依赖结构很简单,因此使用正确的工具仍然可以使推理变得容易。作为机器学习研究人员,我希望使用以下模型,因为使用期望传播技术可以使推理非常有效:

令为第试验的结果。让我们定义随时间变化的参数tX(t)t

0η(t+1)N(η(t),τ2)为。t0

要将与,请引入潜在变量X t η(t)X(t)

Y(t)N(η(t),β2)

且模型为X(t)

Ý 0 X = 0X(t)=1如果则,否则。您实际上可以忽略并将其边缘化,只是说,(其中 cdf为标准范本),但引入潜在变量使推理变得容易。另外,请注意,在原始参数化。Y(t)0X(t)=0Y(t)P[X(t)=1]=Φ(η(t)/β)Φθ(t)=η(t)/β

如果您对实现推理算法感兴趣,请阅读本文。他们使用非常相似的模型,因此您可以轻松调整算法。要理解EP,以下页面可能会有用。如果您有兴趣采用这种方法,请告诉我;我可以提供有关如何实施推理算法的更详细的建议。


0

为了详细说明我的意见,例如p(t)= p exp(-t)的模型很简单,可以通过使用最大似然估计来估计来估计p(t)。但是,概率确实确实呈指数下降。如果您观察到的成功率比早晚观察到的成功率高,那么该模型显然是错误的。振荡行为可以建模为p(t)= p | sint |。两种模型都非常易于处理,可以通过最大可能性解决,但是它们给出的解决方案截然不同。000


1
看来,OP正在寻求成功概率在时间模型,,作为一类马尔可夫过程,而不是指定某些功能的形式。tθ(t)θ(t)
2012年

1
@macro是正确的,我无法提供的参数形式,这是不可取的,因为此函数可以很平滑。我想要类似于隐式马尔可夫模型或卡尔曼滤波器的1阶马尔可夫模型,但具有一个隐式变量,该变量的实数值在0到1之间,并且具有贝努利概率。theta(t)
2012年

@pierre好吧,在进行编辑之前,您似乎正在寻求估计随时间变化的p,而只是建议将HMM作为一种可能的方法。我不建议使用函数形式来表示t的变化方式。我的观点是,如果没有进一步的信息,就可以构建许多不同类型的模型,而我的两个例子表明,如果没有进一步的信息,模型的选择可能会给出截然不同的答案。为什么要坚持使用HMM?如果有人可以使用并且适合您的数据,那么为什么要拒​​绝它,因为它是“非分析性的。”
Michael R. Chernick

我建议寻找方便的解决方案不是解决实际统计问题的方法!
Michael R. Chernick

1
@MichaelChernick最后:我想找到一个分析解决方案,因为我希望这是一个众所周知的问题,人们提出了足够灵活的分析解决方案。但我同意我们的建议,即对“真实动力学”进行建模通常比计算成本更为重要。可悲的是,这是针对大数据的,缓慢的算法将毫无用处:-(
repid2 2012年

0

您的概率随变化,但正如迈克尔所说,您不知道如何。线性与否?它看起来像一个模型选择问题,其中您的概率:tp

p=Φ(g(t,θ))可能取决于高度非线性的函数。是一个边界函数,可保证0和1之间的概率。g(t,θ)Φ

一种简单的探索性方法是尝试使用具有不同非线性多个概率,并根据标准信息准则执行模型选择。Φg()g()

要回答您重新编辑的问题:

如您所说,使用probit仅意味着数值解,但是您可以改用logistic函数:

逻辑函数:P[θ(t+1)]=11+exp(θ(t)+ϵ)

线性化为:logP1P=θ(t)+ϵ

我不确定在卡尔曼滤波方法下该方法如何工作,但仍然相信等非线性规范或许多其他没有随机项的规范会做这份工作。如您所见,从连续性和可区分性的角度来看,此功能是“平滑”的。不幸的是,添加会产生结果概率的跳跃,这是您不希望的,因此我的建议是删除。ε εθ(t+1)=at3+bt2+ct+dϵϵ

对数概率:P[Coint+1=H|t]=11+exp(θ(t))

您已经在bernoulli事件(Markov Chain)中拥有randomnes,并且由于,您正在添加它的其他来源。因此,您的问题可以通过最大似然估计的Probit或Logit来解决,其中为解释变量。我想您同意简约性非常重要。除非您的主要目标是应用给定的方法(HMM和卡尔曼滤波器),而不是为问题提供最简单有效的解决方案。ϵt


如果使用概率,则多元扩展很简单,因为可以估计多元概率。隐含的多元正态分布的协方差矩阵将隐含依赖性。
JDav
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.