随机数生成在计算统计中有哪些重要用途?


15

随机数生成器(RNG)在计算统计中如何重要?为什么?

我了解在为许多统计检验选择样本时,随机性很重要,以避免偏向任一假设,但是在其他一些计算统计领域中,随机数生成器很重要吗?



1
你在问什么?您的问题实际上没有多大意义。
卡尔·威索夫特

2
它可能会更好,要求在他们的地区并不重要。这可能是一个较短的列表。
约翰·科尔曼

2
这个问题很广泛,但标题很吸引人,Matthew的回答很不错。我投票决定重新开放!
贝诺瓦·桑切斯

3
按照传统的SE标准,这显然太宽泛了,相当于一个“大清单”问题,很可能会产生许多小的,没有详尽阐述的答案,这些答案通常会重复已经提供的答案。但是,这里似乎确实有一些真正的价值。为此,必须妥协并保护它。将来,如果没有详细说明和/或已经提到重复的用途,答案将立即删除且不加评论。
gung-恢复莫妮卡

Answers:


17

有很多很多的例子。要列出的方式太多了,可能对于任何人来说都太多了(除了@whuber,永远不要被低估)。

如您所述,在对照实验中,我们通过将受试者随机分为治疗组和对照组来避免抽样偏差。

自举中,我们通过从固定样本中进行替换来随机抽样来近似从总体中重复抽样。这使我们可以估计估计值的方差,等等。

交叉验证中,我们通过将数据随机分成多个切片并组装随机训练和测试集来估计估计值的样本外误差。

置换检验中,我们使用随机置换对原假设下的样本进行采样,从而允许在多种情况下执行非参数假设检验。

装袋中,我们通过对训练数据的自举样本重复执行估计,然后平均结果来控制估计的方差。

随机森林中,我们还通过在每个决策点从可用预测变量中随机采样来进一步控制估计值的方差。

仿真中,我们要求拟合模型随机生成新的数据集,我们可以将其与训练或测试数据进行比较,以帮助验证模型中的拟合和假设。

马尔可夫链蒙特卡洛中,我们通过使用马尔可夫链探索可能结果的空间来从分布中抽样(对于本示例,感谢@Ben Bolker)。

这些只是立即想到的常见日常应用。如果我深入研究,我可能会将该列表的长度加倍。随机性既是研究的重要对象,也是运用的重要工具。


这是完全正确的,但不能解决主要问题:PRNG在序列中具有任何形式的结果结构或可预测性,将导致模拟失败。
卡尔·威索夫特

3
值得一提的是生成大量随机或伪随机数的计算内存成本。RNG在统计数据中的某些应用需要数百至数百万个随机数,但有些则需要更多数量级,这同时承担了这两个成本。
亚历克西斯

5

这是完全正确的,但不能解决主要问题:PRNG 在序列中 具有任何类型的结果结构或可预测性,将导致模拟失败。 卡尔·威索夫特 1月31日15:51

如果您对此感到担忧,则可能应将问题的标题更改为“ RNG选择对蒙特卡洛结果的影响”或类似的内容。在这种情况下,已经在SE交叉验证中考虑过,以下是一些说明

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.