Questions tagged «random-generation»

随机地或(几乎总是)伪随机地生成数字或符号序列的行为;即缺乏任何可预测性或模式。


1
来自随机数生成器的截断数字是否仍然是“随机”的?
在这里,“截断”意味着降低随机数的精度,而不是截断随机数序列。例如,如果我有具有任意精度的真正随机数(从任何分布中抽取,例如,正态,均等),然后我将所有数字截断,以便最终我得到一组个数,每个数字都与小数点后2位。我可以称这组新数字为“随机”吗?ñnnnnnn 当我阅读有关硬件生成的随机数时,我想到了这个问题。维基百科的文章说,他们通过测量物理过程来生成随机数。但是由于这种测量有其局限性(测量误差,有限精度等),我们可以将这些硬件生成的数字称为随机数吗?

4
使用公平d6 独立且均匀地从1到随机绘制整数吗?
我希望通过滚动一定数量的六面骰子(d6)从1到某个特定绘制整数。一个很好的答案将解释为什么其方法会生成统一且独立的整数。ñNN 作为说明性示例,解释的情况下解决方案的工作方式将很有帮助。N = 150N=150N=150 此外,我希望该过程尽可能高效:为生成的每个数字平均滚动最少的d6数。 从senary到十进制的转换是允许的。 这个问题的灵感来自这个Meta线程。

3
根据预期分布测试随机生成的数据
我写了一个程序,可以生成随机数据。如果程序正常运行,则该数据应遵循特定的已知概率分布。我想运行该程序,对结果进行一些计算,并得出一个p值。 在其他人说之前:我了解假设检验无法检测程序何时正常运行。它只能以特定方式检测何时无法正确运行。(即使如此,测试还是应该在X%的时间内失败,具体取决于您选择的显着性水平...) 因此,我试图了解哪种工具合适。尤其是: 我可以根据需要生成任意多的随机数据。我要做的就是让程序运行足够长的时间。因此,我不限于任何特定的样本量。 我对产生p值的技术感兴趣。因此,盯着图说“是的,看起来有点线性”并不是一个有趣的选择。除非有某种方法可以将硬数字放在图形的“奇特性”上。;-) 我到目前为止所知道的: 我已经看到提到了三种主要的测试,听起来可能适用:[Pearson]卡方测试,Kolmogorov-Smirnov测试和Anderson-Darling测试。 卡方检验似乎适用于离散分布,而其他两个检验更适合于连续分布。(?) 各种资料表明,AD测试比KS测试“更好”,但是没有进一步详细介绍。 最终,所有这些测试都可能检测出偏离指定零分布的“不同方式”。但是我还真的不知道它们之间的区别是什么...总之,我正在寻找某种一般性的描述,以说明每种类型的测试最适用的位置以及可以最好地检测到哪些类型的问题。



3
从多元正态分布中提取样本的Cholesky与本征分解
我想绘制样品X〜Ñ(0,Σ)X〜ñ(0,Σ)\mathbf{x} \sim N\left(\mathbf{0}, \mathbf{\Sigma} \right)。维基百科建议任一使用的Cholesky或特征分解,即 Σ = D1个dŤ1个Σ=d1个d1个Ť \mathbf{\Sigma} = \mathbf{D}_1\mathbf{D}_1^T 或 Σ = Q Λ QŤΣ=问Λ问Ť \mathbf{\Sigma} = \mathbf{Q}\mathbf{\Lambda}\mathbf{Q}^T 因此,样品可通过得出: x = D1个vX=d1个v \mathbf{x} = \mathbf{D}_1 \mathbf{v} 或 X = Q Λ--√vX=问Λv \mathbf{x} = \mathbf{Q}\sqrt{\mathbf{\Lambda}} \mathbf{v} 其中 v〜Ñ(0,I)v∼N(0,I) \mathbf{v} \sim N\left(\mathbf{0}, \mathbf{I} \right) 维基百科建议它们在生成样本方面都同样出色,但是Cholesky方法具有更快的计算时间。这是真的?尤其是在使用蒙特卡洛方法时,在数值上,沿对角线的方差可能相差几个数量级?是否有对此问题的正式分析?



3
有关统计随机性的一些问题
从维基百科的统计数据来看: 全局随机性和局部随机性是不同的。大多数随机性的概念都是全局性的,因为它们是基于“从长远来看”序列看起来是真正随机的,即使某些子序列看起来不是随机的。例如,在一个足够长的“真正”随机数字序列中,很可能会有很长的零序列,但总的来说,该序列可能是随机的。局部随机性是指这样的想法,即可能存在最小序列长度,其中随机分布是近似的。相同数字的长距离延伸,即使是由“真正的”随机过程生成的数字,也将减少样本的“局部随机性”(对于10,000位数的序列,它可能仅是局部随机的;小于1,000的序列可能不会出现随机性例如)。 因此没有证明表现出模式的序列不是统计上随机的。根据Ramsey理论的原理,足够大的物体必须包含给定的子结构(“不可能完全混乱”)。 我不太明白这两个句子的含义。 第一句话是否意味着某事物使序列在较长的长度上局部随机,而不是在较短的长度上局部随机? 括号内的示例如何工作? 第二句话是否意味着不能证明具有某种模式的序列不是统计上随机的?为什么? 谢谢

2
生成三个相关的均匀分布的随机变量
假设我们有 X1∼unif(n,0,1),X1∼unif(n,0,1),X_1 \sim \textrm{unif}(n,0,1), X2∼unif(n,0,1),X2∼unif(n,0,1),X_2 \sim \textrm{unif}(n,0,1), 其中unif(n,0,1)unif(n,0,1)\textrm{unif}(n,0,1)是大小均匀的随机样本n,和 Y=X1,Y=X1,Y=X_1, Z=0.4X1+1−0.4−−−−−−√X2.Z=0.4X1+1−0.4X2.Z = 0.4 X_1 + \sqrt{1 - 0.4}X_2. 那么,YYY和的相关性ZžZ为0.40.40.4。 如何将其扩展到三个变量:X1X1个X_1,X2X2X_2,X3X3X_3?


2
随机数和多核软件包
在R中编程时,我已经使用了多核软件包几次。但是,我从未见过有关如何处理随机数的声明。当我将openMP与C一起使用时,我会谨慎使用适当的并行RNG,但对于R,我假设发生了一些明智的事情。任何人都可以确认发生了明智的事情吗? 例 根据文档,我们有 x <- foreach(icount(1000), .combine = "+") %do% rnorm(4) 是如何rnorm产生的?


3
生成均匀分布和相关的随机数对
我想生成一对具有一定相关性的随机数。但是,使用两个正态变量的线性组合的常用方法在这里无效,因为均匀变量的线性组合不再是均匀分布的变量。我需要两个变量要统一。 关于如何生成具有给定相关性的统一变量对的任何想法?

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.