Questions tagged «statistics»

4
如何可靠地添加大指数项而不会出现溢出错误?
蒙特卡洛马尔可夫链中一个非常普遍的问题涉及计算概率,这些概率是大指数项的和, ea1+ea2+...ea1+ea2+... e^{a_1} + e^{a_2} + ... 其中的各组分可以从非常小的范围内,以非常大的。我的方法是排除最大指数项以便:aaaK:=maxi(ai)K:=maxi(ai)K := \max_{i}(a_{i}) a′=K+log(ea1−K+ea2−K+...)a′=K+log(ea1−K+ea2−K+...)a' =K + log\left( e^{a_1 - K} + e^{a_2 - K } + ... \right) ea′≡ea1+ea2+...ea′≡ea1+ea2+...e^{a'} \equiv e^{a_1} + e^{a_2} + ... 这种做法是合理的,如果所有的元素aaa,如果他们不是很大,但不是一个好主意。当然,较小的元素无论如何都不会对浮点数求和,但是我不确定如何可靠地处理它们。在R代码中,我的方法如下所示: if ( max(abs(a)) > max(a) ) K <- min(a) else K <- max(a) ans <- log(sum(exp(a-K))) + …

2
在Python中定义自定义概率密度函数
有没有一种方法,可以使用一些已建立的Python程序包(例如SciPy)来定义我自己的概率密度函数(没有任何先验数据,只需),然后我就可以用它进行计算(例如获得连续随机变量的方差)?当然,我可以使用SymPy或Sage创建一个符号函数并执行操作,但是我想知道是否可以代替使用我自己已经完成的软件包而不是自己完成所有这些工作。f(x)=ax+bf(x)=ax+bf(x) = a x + b

3

3
正确统计以报告加速结果
假设我有一些代码的慢速版本和快速版本,并想报告比较两者的加速值。我运行慢速版本次,快速版本m次,产生时间(s 1,… ,s n)和(f 1,… ,f m)。产生加速的最简单方法是平均的手段: ˉ 小号ñnn米mm(s1个,… ,sñ)(s1,…,sn)(s_1, \ldots, s_n)(f1个,… ,f米)(f1,…,fm)(f_1, \ldots, f_m) 然而,这并未考虑离群值。s¯F¯= m ∑我&lt; ns一世n ∑Ĵ &lt; 米FĴs¯f¯=m∑i&lt;nsin∑j&lt;mfj\frac{\bar{s}}{\bar{f}} = \frac{m \sum_{i<n} s_i}{n \sum_{j<m} f_j} 问题:报告加速数字时使用的最佳统计数据是什么?

1
HPC中本地内存/计算,网络延迟和带宽抖动的统计模型
并行计算通常使用确定性的本地计算速率,等待时间开销和网络带宽来建模。实际上,这些是空间可变的和不确定的。诸如Skinner和Kramer(2005)之类的研究观察到多峰分布,但是性能分析似乎总是使用确定性或高斯分布(不仅是不准确的,而且由于负潜伏期的正概率也不一致)。 是否开发了高保真统计模型?是否考虑了本地计算/内存,延迟和带宽可变性之间的互相关性?
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.