在这份与“设置种子”命令有关的文档中,Stata员工讨论了在生成伪随机数时与种子设置有关的问题。
一个显着的“不”是“不连续使用自然数作为种子的顺序,因为这有一个模式,危害伪随机性”。
一个四分之一的开玩笑的“做”是在您的一生中只设置一个种子,然后在每个实验结束时记录所生成过程的“状态”,以便下一个实验在该点继续进行该进程已停止的位置。
显然,以上建议取决于一个人在其研究生命中将产生的伪随机数的预期数目。也许梅森捻线机可以满足许多研究人员的终生需求。
现在,我对PRNG的理论或实践经验并不丰富,因此我无法争论这些建议- 应该从理论基础和严格的数学统计证明它们是有效的还是无效的。
所以,我的问题是
1)您能否帮助解释或使以上给出的建议无效,或指向涉及此类问题的参考?
2)您可以提供提供“最佳做法”的参考资料吗?
3)您如何在自己的工作中进行这项工作,为什么?
作为问题3)的示例,假设对于Monte Carlo研究,您想要生成样本,每个样本的大小为,并且的周期足够大于。您会使用一个种子生成所有伪随机数,还是习惯每个样本更改种子?(但这仅是示例-我认为这里更一般的答案是值得的)。
一个相关的线程(尽管更加集中)是
在每个代码块之前还是每个项目一次设置种子?
我觉得这也许应该是社区Wiki,请对此做出决定。