是否有一个正式的数学证明了解决德国坦克问题是的函数仅参数ķ(观察到的样本数)和米(观察到的样品中的最大值)?换句话说,可以证明该解决方案与最大值以外的其他样本值无关吗?
是否有一个正式的数学证明了解决德国坦克问题是的函数仅参数ķ(观察到的样本数)和米(观察到的样品中的最大值)?换句话说,可以证明该解决方案与最大值以外的其他样本值无关吗?
Answers:
概率论中的常见问题是在给定特定模型并给定涉及参数(称为)的情况下,观察的概率。例如,纸牌游戏或骰子游戏中特定情况的概率通常非常简单。
但是,在许多实际情况下,我们正在处理相反的情况(推论统计)。也就是说:给定了观测值,现在模型是未知的,或者至少我们不知道某些参数。
在这些类型的问题中,我们通常将其称为参数的可能性,这是对给定观测值的特定参数的相信率。假设模型参数假设为真,则将该术语表示为与观测值的概率成比例。
对于给定的参数值,某个观测值的可能性更大(相对于其他参数值的概率),观测值支持该特定参数(或假设该参数的理论/假设)越多。(相对)较高的可能性将加强我们对参数值的信念(对此有更多的哲学意义)。
现在对于德国坦克问题,一组样本的似然函数为:
从参数的均匀分布考虑样本时,无论观察样本{1、2、10}还是样本{8、9、10}都没有关系。这两个样本都具有的可能性,并且使用可能性的想法,一个样本比另一个样本没有更多地介绍参数。
高值{8,9,10}可能会使您认为/相信应该更高。但是,只有值{10}确实为您提供了有关可能性的相关信息(值10告诉您将为10或更高,其他值8和9对此信息没有任何帮助)。
该定理告诉您,某个统计量(即,观测值的某些函数,例如均值,中位数或德国坦克问题中的最大值)足以(包含所有信息)您可以在似然函数中排除依赖于其他观测值,以使该因子既不依赖于参数也不依赖于参数和(和将数据与假设参数值相关联的似然函数部分仅取决于统计信息,而不取决于整个数据/观察值。
德国坦克问题的情况很简单。您可以在上面看到,上述“可能性”的整个表达式仅取决于统计,其余值无关紧要。
假设我们反复玩以下游戏:本身是一个随机变量,并以100或110的相等概率绘制。然后绘制样本。
我们要根据观察到的选择一种猜测的策略,以最大程度地提高对的正确猜测的可能性。
除非样本中的数字之一大于100,否则适当的策略是选择100。
当许多趋向于都是接近于100的高值(但没有正好超过100)时,我们可能会很想选择参数值110 ,但这是错误的。当真实参数值是100时,这样的观察的概率会比110时大。因此,如果我们在这种情况下猜测参数值为100,那么我们犯错误的可能性就较小(因为当真实值为100而不是真实值为110时,这些接近100的高值但仍然低于该值的情况更常发生。
您尚未提供“问题”的精确表述,因此不清楚您要证明的内容。从贝叶斯角度来看,后验概率确实取决于所有数据。但是,每次观察特定的序列号将最支持该序列号。也就是说,给定任何观察值,假设“实际坦克数为 ” 的假设的后验概率与先验概率之比将大于“实际坦克数为[以外的数字]” 的假设。因此,如果我们从统一的先验开始,那么在看到该观察值之后,将具有最高的后验。
考虑一下我们有数据点并假设。显然,的后验为零。而我们的后验将比以前更大。原因是在贝叶斯推理中,缺乏证据就是缺乏证据。任何时候,我们有我们的机会可能已经作出的观察,将有我们的概率降低,但不这样做,概率增大。因为我们可以看到,这将使后验者设置为零,所以我们没有看到它的事实意味着我们应该为16 Ñ = 13 ,15 Ñ = 13 ,15 Ñ = 13 14 ,15 ,16 ,。。。N = 15 16 N = 13 N = 15 N = 13 N = 13 N = 15 N。但是请注意,数字越小,我们可以看到的更多数字将排除该数字。对于,在看到之后,我们将拒绝该假设。但是对于,我们将需要至少来拒绝该假设。由于假设比更容易伪造,因此我们不伪造的事实更多地证明了,而不是不伪造的事实更证明了。
因此,每当我们看到一个数据点时,它会将位于其下方的所有元素的后验置零,并增加其他所有元素的后验,而较小的数字将获得最大的提升。因此,获得最大提升的数字将是后验未设置为零的最小数字,即观测值的最大值。
小于最大值的数字会影响最大值获得的提升幅度,但不会影响最大值获得最大提升的总体趋势。考虑上面的示例,我们已经看过。如果我们看到的下一个数字是,将会有什么效果?它可以帮助个大于,但是两个数字都已被拒绝,因此这无关紧要。它在以上帮助了,但是在以上已经帮助了,因此这并不影响哪个数字得到了最大的帮助。