校正正态分布的时钟精度


10

我有一个实验,该实验在分布于世界各地的数百台计算机上执行,以测量某些事件的发生。这些事件彼此依赖,因此我可以按升序对它们进行排序,然后计算时间差。

事件应该按指数分布,但是当绘制直方图时,这就是我得到的:

事件直方图

计算机上时钟的不精确性导致某些事件的时间戳早于它们所依赖的事件的时间戳。

我想知道是否可以将时钟同步归咎于PDF的峰值不为0(它们将整个对象向右移)吗?

如果时钟差异是正态分布的,我是否可以仅假设效果会相互补偿,从而仅使用计算出的时间差?

Answers:


13

时钟同步问题确实可能导致峰值向右移动。R中的以下模拟显示了这种现象。我使用指数时间和正常时钟差来获得大致类似于您的图片的形状:

钟表

左侧的分布(实际差异,无误差测量)在0处达到峰值,而右侧的分布(经误差测量的差)在100附近达到峰值。

R代码:

set.seed(20120904)

# Generate exponential time differences:
x<-rexp(100000,1/900)

# Generate normal clock differences:
y<-rnorm(100000,0,50)

# Resulting observations:
xy<-x+y

# Truncate at 500:
xy<-xy[xy<=500]

# Plot histograms:
par(mfrow=c(1,2))
hist(x[x<=500],breaks=100,col="blue",main="Actual differences")
hist(xy,breaks=100,col="blue",main="Observed differences")
lines(c(0,0),c(0,550),col="red")

如果时钟差是平均值为0的正常值,则在观察到的差值的平均值应等于实际差值的意义上,应消除差值。是否发生这种情况取决于发生第一事件的计算机与发生第二事件的计算机之间是否存在系统差异。


4
+1很好地说明了这一点。在数学上,数据是从误差分布和(假定的)指数分布的总和中得出的。试图估计误差分布并对数据进行反卷积以估计真实分布是很诱人的。
ub
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.