计算科学 statistics

4

蒙特卡洛马尔可夫链中一个非常普遍的问题涉及计算概率，这些概率是大指数项的和， ea1+ea2+...ea1+ea2+... e^{a_1} + e^{a_2} + ... 其中的各组分可以从非常小的范围内，以非常大的。我的方法是排除最大指数项以便：aaaK:=maxi(ai)K:=maxi(ai)K := \max_{i}(a_{i}) a′=K+log(ea1−K+ea2−K+...)a′=K+log(ea1−K+ea2−K+...)a' =K + log\left( e^{a_1 - K} + e^{a_2 - K } + ... \right) ea′≡ea1+ea2+...ea′≡ea1+ea2+...e^{a'} \equiv e^{a_1} + e^{a_2} + ... 这种做法是合理的，如果所有的元素aaa，如果他们不是很大，但不是一个好主意。当然，较小的元素无论如何都不会对浮点数求和，但是我不确定如何可靠地处理它们。在R代码中，我的方法如下所示： if ( max(abs(a)) > max(a) ) K <- min(a) else K <- max(a) ans <- log(sum(exp(a-K))) + …

24 monte-carlo floating-point statistics

2

在Python中定义自定义概率密度函数

有没有一种方法，可以使用一些已建立的Python程序包（例如SciPy）来定义我自己的概率密度函数（没有任何先验数据，只需），然后我就可以用它进行计算（例如获得连续随机变量的方差）？当然，我可以使用SymPy或Sage创建一个符号函数并执行操作，但是我想知道是否可以代替使用我自己已经完成的软件包而不是自己完成所有这些工作。f(x)=ax+bf(x)=ax+bf(x) = a x + b

20 python statistics probability

3

欧氏距离（八度）

我想知道是否存在一种快速方法来计算八度中两个向量的欧几里得距离。似乎没有特殊的功能，所以我应该只使用带有的公式sqrt吗？

17 octave discretization nonlinear-equations newton-method visualization fluid-dynamics mesh-generation finite-element finite-volume optimization algorithms approximation fluid-dynamics navier-stokes comsol modeling optimization sparse-matrix matrix condition-number visualization matlab quadrature blas intel-mkl finite-element gpu discontinuous-galerkin mathematica optimization convex-optimization algorithms reference-request matlab statistics finite-element numerical-analysis petsc molecular-dynamics machine-learning statistics visualization open-source statistics image-processing visualization python petsc finite-element fluid-dynamics stability navier-stokes incompressible

3

正确统计以报告加速结果

假设我有一些代码的慢速版本和快速版本，并想报告比较两者的加速值。我运行慢速版本次，快速版本m次，产生时间（s 1，… ，s n）和（f 1，… ，f m）。产生加速的最简单方法是平均的手段： ˉ 小号ñnn米mm（s1个，… ，sñ）(s1,…,sn)(s_1, \ldots, s_n)（f1个，… ，f米）(f1,…,fm)(f_1, \ldots, f_m) 然而，这并未考虑离群值。s¯F¯= m ∑我< ns一世n ∑Ĵ < 米FĴs¯f¯=m∑i<nsin∑j<mfj\frac{\bar{s}}{\bar{f}} = \frac{m \sum_{i<n} s_i}{n \sum_{j<m} f_j} 问题：报告加速数字时使用的最佳统计数据是什么？

12 statistics publications

1

HPC中本地内存/计算，网络延迟和带宽抖动的统计模型

并行计算通常使用确定性的本地计算速率，等待时间开销和网络带宽来建模。实际上，这些是空间可变的和不确定的。诸如Skinner和Kramer（2005）之类的研究观察到多峰分布，但是性能分析似乎总是使用确定性或高斯分布（不仅是不准确的，而且由于负潜伏期的正概率也不一致）。是否开发了高保真统计模型？是否考虑了本地计算/内存，延迟和带宽可变性之间的互相关性？

11 performance hpc statistics

Questions tagged «statistics»