造型
正确的过程是:(1)将情况建模为概率空间;(2)定义一个事件的关注点;(3)确定其概率。可以通过随机变量(即上的函数)来指定事件(可测量的函数,但这里不必担心)。空间可以由一个或多个随机变量及其联合分布隐式给出。S=(Ω,Σ,P)E∈ΣP(E)ESS
步骤(1)可能会有一些余地。有时可以通过比较某些事件的概率与我们直观期望的概率来测试建模的适当性。特别是,查看某些边际或条件概率可能有助于您了解建模的适当程度。
有时,建模或其中的一部分已经完成,我们可以在此基础上进行构建。在统计数据(在某一点),我们通常都已经给定的实值随机变量
IID与固定但未知。X1,…,Xn∼Dist(θ)θ∈R
置信区间估计器
置信度下的置信区间估计器(CIE)是具有域的一对函数和,
使得,写。我更喜欢用“置信区间估计器 ”一词来强调,重要的是功能及其功能特性。
和都是隐式给定样本空间上的函数,也就是说,它们是随机变量。给定一个观测值,说到γLRRnP(L(X)≤θ≤R(X))≥γX=(X1,…,Xn)L(X)R(X)x∈RnL(x)≤θ≤R(x)没有意义,因为这不是事件,因为它不包含任何随机变量。
首选项
假设一个可能已经从一组门票,其中一个抽出一张彩票之间选择已经从一组,其中一个抽出部分由中奖彩票的,以及一个成分由中奖彩票的,并假定。两张票都已经被抽出,但是没有人透露。当然,在所有其他条件相同的情况下,我们宁愿再买第二张票,因为它有γ1γ2γ1<γ2成为中奖彩票的机率要比第一张彩票高出。基于生成观察值的随机过程的概率属性,对不同观察值(本示例中为两张票证)的偏好很好。请注意,我们并不是说任何彩票都有较高的可能性成为中奖彩票。如果我们这样说,那么从口语意义上讲就是“概率”,这可能意味着任何意义,因此最好在这里避免。
对于不同置信度的CIE,其他所有条件通常都不相等,因为较高的置信度将使CIE传递的间隔趋于更宽。因此,在这种情况下,我们甚至无法给出偏好。我们不能说我们通常更喜欢使用具有较高置信度的CIE计算的间隔。但是,如果其他所有条件都相等,我们希望使用具有最高可用置信度的CIE生成的间隔。例如,如果我们要在一个以置信水平的CIE输出的间隔和一个从该长度的所有间隔集中随机绘制的相同长度的间隔之间进行选择,我们肯定会更喜欢前者。0.95
简单先验示例
让我们考虑一个例子,其中扩展了概率建模以使我们对随机变量感兴趣的参数成为可能。假设是具有离散随机变量
,并且对于每个,条件上的知识,我们有 IID设构成为在所述正态分布的均值(古典)CIE置信水平,即是,对于每个,我们有θP(θ=0)=P(θ=1)=1/2ϑ∈Rθ=ϑX1,…,Xn∼N(ϑ,1)L,Rγϑ∈RP(L(X)≤ϑ≤R(X)|θ=ϑ)≥γ,表示。P(L(X)≤θ≤R(X))≥γ
假设我们观察到一个具体值。现在,位于和指定的间隔内的概率是多少,即?表示独立的,正态分布的随机变量的联合PDF,均值和标准偏差。使用贝叶斯规则和总概率定律进行的计算显示:
x∈Rn(X1,…,Xn)θL(x)R(x)P(L(x)≤θ≤R(x)|X=x)fμnμσ=1
P(L(x)≤θ≤R(x)|X=x)=⎧⎩⎨⎪⎪⎪⎪⎪⎪⎪⎪⎪⎪f0(x)f0(x)+f1(x)f1(x)f0(x)+f1(x)10if L(x)≤0≤R(x)<1if 0<L(x)≤1≤R(x)if L(x)≤0 and 1≤R(x)else
值得注意的是,该概率与置信度完全无关!因此,即使在CIE的输出中包含概率的问题是有意义的,也就是说,如果是我们概率模型中的事件,则其概率通常不是,但可以完全不同。
γθL(X)≤θ≤R(X)γ
实际上,一旦我们就先验达成一致(例如的简单离散分布)并且我们有了一个观测值,那么对进行条件设置可能比查看CIE的输出更为有益。精确地,对于我们得到:
X X { μ 0,μ 1 } = { 0 ,1 } P (θ = μ 0 | X = X )= ˚F μ 0(X )θxx{μ0,μ1}={0,1}
P(θ=μ0|X=x)=fμ0(x)fμ0(x)+fμ1(x)