Questions tagged «sampling»

使用概率方法从明确指定的总体中创建样本和/或根据指定的分布生成随机数。由于此标签含糊不清,因此请考虑对前者使用[调查抽样],对后者考虑[蒙特卡洛]或[模拟]。对于从已知分布中创建随机样本的问题,请考虑使用[random-generation]标签。


2
吉布斯采样与常规MH-MCMC
我一直在阅读有关Gibbs采样和Metropolis Hastings算法的文章,并有几个问题。 据我了解,在吉布斯抽样的情况下,如果我们有一个大的多元问题,我们从条件分布中抽样,即抽样一个变量,而其他变量保持不变,而在MH中,我们从整个联合分布抽样。 该文件说的一件事是,建议的样本始终在Gibbs抽样中接受,即建议的接受率始终为1。对我来说,这似乎是一个很大的优势,因为对于大型多元问题,MH算法的拒绝率似乎变得很大。如果确实如此,那么为什么一直不使用Gibbs Sampler来生成后验分布的原因是什么?

2
模拟给定功率和互谱密度的时间序列
给定它们的协方差矩阵(它们的功率谱密度(PSD)和交叉功率谱密度(CSD)),我很难生成一组固定的彩色时间序列。 我知道,给定两个时间序列和,我可以使用许多广泛使用的例程来估算其功率谱密度(PSD)和交叉谱密度(CSD)。和Matlab等中的功能。PSD和CSD组成协方差矩阵: yI(t)yI(t)y_{I}(t)yJ(t)yJ(t)y_{J}(t)psd()csd()C(f)=(PII(f)PJI(f)PIJ(f)PJJ(f)),C(f)=(PII(f)PIJ(f)PJI(f)PJJ(f)), \mathbf{C}(f) = \left( \begin{array}{cc} P_{II}(f) & P_{IJ}(f)\\ P_{JI}(f) & P_{JJ}(f) \end{array} \right)\;, ,通常是频率的函数。 fff 如果我想做相反的事情怎么办? 给定协方差矩阵,如何生成和y_ {J}(t)的实现?yI(t)yI(t)y_{I}(t)yJ(t)yJ(t)y_{J}(t) 请包括任何背景理论,或指出执行此操作的任何现有工具(Python中的任何工具都很好)。 我的尝试 以下是我尝试过的内容以及我注意到的问题的描述。本书读了很长一段时间,如果其中包含误用的术语,则抱歉。如果可以指出错误的地方,那将非常有帮助。但是我的问题是上面的粗体字。 PSD和CSD可以写为时间序列傅立叶变换的乘积的期望值(或整体平均值)。因此,协方差矩阵可以表示为: C(f)=2τ⟨Y†(f)Y(f)⟩,C(f)=2τ⟨Y†(f)Y(f)⟩, \mathbf{C}(f) = \frac{2}{\tau} \langle \mathbf{Y}^{\dagger}(f) \mathbf{Y}(f) \rangle \;, 其中 ÿ(˚F)= (y〜一世(f)ÿ〜Ĵ(f))。ÿ(F)=(ÿ〜一世(F)ÿ〜Ĵ(F))。 \mathbf{Y}(f) = \left( \begin{array}{cc} \tilde{y}_{I}(f) & \tilde{y}_{J}(f) \end{array} \right) \;. 协方差矩阵是Hermitian矩阵,其实特征值可以为零或为正。因此,可以将其分解为 Ç(˚F)= X(f)λ1个2(f)一世λ12(f)X†(f),C(F)=X(F)λ1个2(F)一世λ1个2(F)X†(F), \mathbf{C}(f) …

3
如何从
我想根据密度f (a )∝ c a d a − 1进行采样 F(一)α Ç一种da − 1Γ (a )1个(1 ,∞ )(一)F(一种)∝C一种d一种-1个Γ(一种)1个(1个,∞)(一种) f(a) \propto \frac{c^a d^{a-1}}{\Gamma(a)} 1_{(1,\infty)}(a) 其中CCc和ddd严格为正。(动机:当Gamma密度的形状参数具有一致的先验值时,这对于Gibbs采样很有用。) 有谁知道如何轻松地从这种密度采样?也许这是标准的,只是我不知道的事情? 我能想到一个笨排斥sampliing算法,将更多或更少的工作(找到模式的一种∗一种∗a^*的FFf,样品(a,u)(一种,ü)(a,u)从均匀在一个大的盒[0,10a∗]×[0,f(a∗)][0,10a∗]×[0,f(a∗)][0,10a^*]\times [0,f(a^*)]和拒绝如果u>f(a)u>f(a)u>f(a)),但(i)其是不是在所有有效的和(ii)f(a∗)f(a∗)f(a^*)对于中等大小的和d来说,对于计算机来说它太大了,难以处理。(请注意,大c和d的模式大约为a = c d。)cccdddcccddda=cda=cda=cd 在此先感谢您的帮助!

3
优化技术是否映射到采样技术?
从任何通用采样算法中,可以得出一种优化算法。 事实上,为了最大化任意函数,其足以从绘制样品克〜ë ˚F / Ť。对于足够小的T,这些样本将落在函数f的全局最大值(或实践中的局部最大值)附近。F:x → f(x)F:X→F(X)f: \textbf{x} \rightarrow f(\textbf{x})G〜êF/吨G〜ËF/Ťg \sim e^{f/T}ŤŤTFFf 我所说的“采样”是指从给定一个对数似然函数的分布中抽取一个伪随机样本。例如,MCMC采样,Gibbs采样,波束采样等。“优化”是指尝试找到使给定函数的值最大化的参数。 反过来可能吗?给定启发式查找函数或组合表达式的最大值,是否可以提取有效的采样过程? 例如,HMC似乎利用了梯度信息。我们能否构造一个利用类似于BFGS的Hessian近似的采样程序?(编辑:显然是:http : //papers.nips.cc/paper/4464-quasi-newton-methods-for-markov-chain-monte-carlo.pdf)我们可以在组合问题中使用MCTS,我们可以翻译一下吗?进入抽样程序? 背景:采样困难通常是大部分概率分布都位于非常小的区域内。有一些有趣的技术可以找到这样的区域,但是它们并不能直接转化为无偏采样程序。 编辑:我现在有一种挥之不去的感觉,即这个问题的答案在某种程度上等同于等价类#P和NP的相等,使得答案可能是“否”。它确实解释了为什么每种采样技术都会产生优化技术,但反之则不然。

4
如何产生连续次数的非整数伯努利成功?
鉴于: 具有未知偏差(正面)的硬币。ppp 严格正实数 。a>0a>0a > 0 问题: 生成具有偏差的随机伯努利变量。papap^{a} 有谁知道如何做到这一点?例如,当是一个正整数时,则可以掷硬币,并查看所有结果是否都是正面:如果结果为'0',否则为'1'。困难在于不一定是整数。另外,如果我知道偏差,我就可以制造具有期望偏差的另一枚硬币。 一个一个paaaaaaaaappp
18 sampling 

1
众包数据的采样模型?
我正在开发一个计划在发展中国家使用的开放式健康调查应用程序。 基本想法是,调查访谈是众包的 -由无组织的志愿者执行,他们使用移动设备提交他们进行的访谈的表格数据,并且每次调查都附带访谈位置的GPS数据。 由政府机构编制的传统调查通常使用某种标准抽样模型-通常是概率抽样模型来实施。这就需要很多无法始终执行的集中计划。(提到这个是为了让我的问题在正确的背景下出现) 可以说,志愿者将在其周围实施便利采样。他将任意采访他可以联系到的人数。 基本问题是:如何理解和表征该测量系统的整体采样模型?是否有任何方法或组合模型来处理此类情况?
18 sampling 

5
为什么我们不利用t分布来构造比例的置信区间?
要计算具有未知总体标准偏差(sd)的均值的置信区间(CI),我们采用t分布估算总体标准差。值得注意的是,CI=X¯±Z95%σX¯CI=X¯±Z95%σX¯CI=\bar{X} \pm Z_{95\% }\sigma_{\bar X}其中。但是因为我们没有总体标准偏差的点估计,所以我们通过近似进行估计,其中σX¯=σn√σX¯=σn\sigma_{\bar X} = \frac{\sigma}{\sqrt n}CI=X¯±t95%(se)CI=X¯±t95%(se)CI=\bar{X} \pm t_{95\% }(se)se=sn√se=snse = \frac{s}{\sqrt n} 相反,对于人口比例,要计算CI,我们近似为其中提供和CI=p^±Z95%(se)CI=p^±Z95%(se)CI = \hat{p} \pm Z_{95\% }(se)se=p^(1−p^)n−−−−−√se=p^(1−p^)nse = \sqrt\frac{\hat{p}(1-\hat{p})}{n}np^≥15np^≥15n \hat{p} \ge 15n(1−p^)≥15n(1−p^)≥15n(1-\hat{p}) \ge 15 我的问题是,为什么我们对人口比例的标准分布感到自满?

4
“随机样本”和“ iid随机变量”是同义词吗?
我一直很难理解“随机样本”和“ iid随机变量”的含义。我试图从几个方面找出含义,但是却越来越困惑。我将在此发布的内容尝试并了解: Degroot的概率与统计说: 随机样本/ iid /样本大小:考虑真实行上的给定概率分布,该概率分布可以用pf或pdf。据说有随机变量如果这些随机变量是独立的,并且每个变量的边际pf或pdf为从该分布形成一个随机样本。这种随机变量也被认为是独立且均等分布的,简称iid。我们将随机变量的数量n称为样本量。FFfññnX1个,。。。, XñX1个,。。。,XñX_1 , . . . , X_nFFf 但是我写过的另一本统计书说: 在随机抽样中,我们保证总体中的每个个体单元都有相等的被选择的机会(概率)。 因此,我觉得iid是构成随机样本的元素,而拥有随机样本的过程就是随机抽样。我对吗? PS:我对这个话题非常困惑,因此,我感谢您详尽的答复。谢谢。

1
MCMC在有界参数空间上?
我想一个问题申请MCMC,但我的先验概率(在我的情况下,他们是))被限制在一个区域?我可以使用普通的MCMC并忽略掉在限制区域(在我的情况下是[0,1] ^ 2)之外的样本,即当新的过渡区域超出限制区域时重用过渡函数吗?α∈[0,1],β∈[0,1]α∈[0,1],β∈[0,1]\alpha\in[0,1],\beta\in[0,1]

2
来自两个独立的伯努利人口的抽样分布
让我们假设我们有两个独立的伯努利随机变量的样本,乙ë - [R( θ1个)乙Ë[R(θ1个)\mathrm{Ber}(\theta_1)和乙È - [R( θ2)乙Ë[R(θ2)\mathrm{Ber}(\theta_2)。 我们如何证明吗?(X¯1−X¯2)−(θ1−θ2)θ1(1−θ1)n1+θ2(1−θ2)n2−−−−−−−−−−−−−−√→dN(0,1)(X¯1−X¯2)−(θ1−θ2)θ1(1−θ1)n1+θ2(1−θ2)n2→dN(0,1)\frac{(\bar X_1-\bar X_2)-(\theta_1-\theta_2)}{\sqrt{\frac{\theta_1(1-\theta_1)}{n_1}+\frac{\theta_2(1-\theta_2)}{n_2}}}\xrightarrow{d} \mathcal N(0,1) 假设。n1≠n2n1≠n2n_1\neq n_2


2
“每个蓝色T恤衫的人”是否都是系统样本?
我正在教入门统计课程,并正在审查采样类型,包括系统采样,即您对第k个个体或对象进行采样。 一个学生问对每个具有特定特征的人进行采样是否会完成相同的事情。 例如,对每个穿着蓝色T恤衫的人进行抽样是否足够随机并足以代表整个人口?至少,如果您要问的问题不是“您喜欢穿哪种颜色的T恤?” 我的感觉不是,但是我想知道这里是否有人对此有任何想法。
17 sampling 

4
计算所需的样本量,方差估计的精度?
背景 我有一个未知分布的变量。 我有500个样本,但是我想证明我可以计算方差的精度,例如说500的样本量就足够了。我也想知道以的精度估算方差所需的最小样本量X%X%X\%。 问题 我该如何计算 给定样本量,我估计方差的精度n=500n=500n=500?的n=Nn=Nn=N? 如何计算以精度估算方差所需的最小样本数XXX? 例 图1基于500个样本的参数密度估计。 图2这是我使用500个样本的子样本计算出的x轴上的样本大小与y轴上的方差估计值之间的关系图。想法是随着n的增加,估计值将收敛到真实方差。 然而,估计是无效的独立自样品用于估计方差n∈[10,125,250,500]n∈[10,125,250,500]n \in [10,125,250,500]是不相互独立的或在用于计算方差的样本n∈[20,40,80]n∈[20,40,80]n\in [20,40,80]

3
中位数的无偏估计
假设我们在上支持一个随机变量,我们可以从中抽取样本。我们如何得出的中位数的无偏估计?XXX[0,1][0,1][0,1]XXX 当然,我们可以生成一些样本并取样本中值,但是我知道这通常不会产生偏差。 注意:这个问题与我的上一个问题有关,但并不完全相同,在这种情况下,只能近似采样。XXX
16 sampling 

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.