让排序的数据是。为了理解经验CDF ģ,考虑的值中的一个X 我 --let称之为γ --and假设一些数ķ的X 我小于γ和吨≥ 1的X 我等于γ。选择一个区间[ α ,β ],在所有可能的数据值中,只有γx1≤x2≤⋯≤xnGxiγkxiγt≥1xiγ[α,β]γ出现。然后,通过定义,该时间间隔内具有恒定值ķ / Ñ为小于数γ,并跳转到恒定值(ķ + 吨)/ Ñ为数字大于γ。Gk/nγ(k+t)/nγ
∫b0xh(x)dx[α,β]ht/nγ[α,β]
∫βαxh(x)dx=(xG(x))|βα−∫βαG(x)dx=(βG(β)−αG(α))−∫βαG(x)dx.
γG
∫βαG(x)dx=∫γαG(α)dx+∫βγG(β)dx=(γ−α)G(α)+(β−γ)G(β).
G(α)=k/n,G(β)=(k+t)/n
∫βαxh(x)dx=(βG(β)−αG(α))−((γ−α)G(α)+(β−γ)G(β))=γtn.
X
tn=1n+⋯+1n
γG
∫b0xh(x)dx=∑i:0≤xi≤b(xi1n)=1n∑xi≤bxi.
1/n[0,b]1/n1/mm[0,b]
kb1n∑xi≤bxi=k.kj
1n∑i=1j−1xi≤k<1n∑i=1jxi,
b[xj−1,xj)b
R
cumsum
使用which
搜索族执行部分总和计算,并找到与任何指定值相交的地方,如:
set.seed(17)
k <- 0.1
var1 <- round(rgamma(10, 1), 2)
x <- sort(var1)
x.partial <- cumsum(x) / length(x)
i <- which.max(x.partial > k)
cat("Upper limit lies between", x[i-1], "and", x[i])
在此示例中,从指数分布中提取的数据的输出为
上限介于0.39和0.57之间
0.1=∫b0xexp(−x)dx,0.531812
G