对于最小的联合累积分布函数x(1)&最大x(n)为样品n从高斯分布均值μ和标准偏差σ是
F(x(1),x(n);μ,σ)=Pr(X(1)<x(1),X(n)<x(n))=Pr(X(n)<x(n))−Pr(X(1)>x(1),X(n)<x(n)=Φ(x(n)−μσ)n−[Φ(x(n)−μσ)−Φ(x(1)−μσ)]n
其中Φ(⋅)是标准的高斯CDF。关于x(1)和微分x(n)给出联合概率密度函数。
f(x(1),x(n);μ,σ)=n(n−1)[Φ(x(n)−μσ)−Φ(x(1)−μσ)]n−2⋅ϕ(x(n)−μσ)⋅ϕ(x(1)−μσ)⋅1σ2
其中是标准的高斯PDF。取不包含参数的对数和丢弃项可提供对数似然函数ϕ(⋅ )
ℓ(μ,σ;x(1),x(n))=(n−2)log[Φ(x(n)−μσ)−Φ(x(1)−μσ)]+logϕ(x(n)−μσ)+logϕ(x(1)−μσ)−2logσ
这看起来并不很听话的,但它很容易看到它最大化的任何值通过设定μ = μ = X (ñ ) + X (1 )σ,即中点,当一个CDF的自变量为另一个的自变量的负数时,第一项最大化。第二和第三项代表两个独立正态变量的联合可能性。μ=μ^=x(n)+x(1)2
代μ到对数似然&写- [R = X (Ñ ) - X (1 )给出
ℓ (σ ; X (1 ),X (Ñ ),μ)= (ñ - 2 )日志[ 1 - 2 Φ (− rμ^r=x(n)−x(1)
ℓ(σ;x(1),x(n),μ^)=(n−2)log[1−2Φ(−r2σ)]−r24σ2−2logσ
此表达必须(例如,与数字最大化optimize
来自R的stat
包),以找到σ。(原来,σ = ķσ^,其中 ķ只在根据一个恒定 Ñ -perhaps有人数学上更熟练比我能显示为什么。)σ^=k(n)⋅rkn
没有附带的精确度,估算就没有用。观察到的Fisher信息可以通过数字方式进行评估(例如,hessian
使用R's numDeriv
包装),并用于计算近似标准误差:
我(σ)=-∂2ℓ(σ; μ)
I(μ)=−∂2ℓ(μ;σ^)(∂μ)2∣∣∣μ=μ^
I(σ)=−∂2ℓ(σ;μ^)(∂σ)2∣∣∣σ=σ^
以 偏差(MLE是否一致),方差和均方误差来比较的似然度和矩量法估计值,将是很有意思的 。除了最小和最大以外,对于那些已知样本均值的群体也存在估计问题。σ