Questions tagged «sampling»

使用概率方法从明确指定的总体中创建样本和/或根据指定的分布生成随机数。由于此标签含糊不清,因此请考虑对前者使用[调查抽样],对后者考虑[蒙特卡洛]或[模拟]。对于从已知分布中创建随机样本的问题,请考虑使用[random-generation]标签。

5
如何生成均值为的序列?
我知道如何生成均值为的序列。例如,在Matlab中,如果我想生成长度为的序列,则为:0 ± 1 10000±1±1\pm 1000±1±1\pm 1100001000010000 2*(rand(1, 10000, 1)<=.5)-1 然而,如何产生一个与平均序列,即,具有稍微优选?0.05 1±1±1\pm 10.050.050.0511个1

2
拉丁超立方采样渐近线
我正在尝试为我正在研究的问题构建证明,而我所做的一个假设是,我从中采样的点集在整个空间中都是密集的。实际上,我使用拉丁超立方体采样来获取整个采样空间中的点。我想知道的是,如果让您的样本大小趋于那么拉丁超立方体样本在整个空间中是否密集?如果是这样,将不胜感激对此事实的引用。∞∞\infty

1
如何得出吉布斯采样?
我实际上是在犹豫地提出这个问题,因为恐怕我会被其他问题或维基百科上有关Gibbs抽样的问题提及,但是我不觉得它们描述了即将发生的事情。 给定条件概率: p(x|y)p(x|y)p(x|y)p(x|y)x=x0x=x1y=y01434y=y12646p(x|y)y=y0y=y1x=x01426x=x13446 \begin{array}{c|c|c} p(x|y) & y = y_0 & y = y_1 \\ \hline x = x_0 & \tfrac{1}{4} & \tfrac{2}{6} \\ \hline x = x_1 & \tfrac{3}{4} & \tfrac{4}{6} \\ \end{array} 还有一个条件概率: p(y|x)p(y|x)p(y|x)p(y|x)x=x0x=x1y=y01337y=y12347p(y|x)y=y0y=y1x=x01323x=x13747 \begin{array}{c|c|c} p(y|x) & y = y_0 & y = y_1 \\ \hline x = x_0 …
11 sampling  mcmc  gibbs 

1
如果“ .632规则”中的概率不相等怎么办?
此问题源于有关“ .632规则”的问题。我在编写时特别参考了user603的回答/表示,以简化事情。 该答案以大小为的样本开始并从集合(称为)N的不同项中进行替换。第样本与N 的特定元素不同的概率为n,n,n,nnnithithi^{th}sisis_immm(1−1/n).(1−1/n).(1 - 1/n). 在该答案中,N的所有元素都有被随机抽取的同等机会。 我的问题是:假设在上面的问题中要绘制的项目是按正态分布的。也就是说,我们将标准正态曲线从细分为,细分为(例如)100个等长子区间。N中的100个项目中的每一个都有被绘制的概率,该概率等于曲线在其相应间隔中所占的面积。Z=−4Z=−4Z = -4Z=4Z=4Z = 4 我的想法如下: 我的推理与链接答案中的推理类似。的概率,与 N的元素,是其中是绘制的概率si≠msi≠ms_i \ne mmmmP(si≠m)=(1−Fi)P(si≠m)=(1−Fi)P(s_i \neq m) = (1 - F_i)FiFiF_isi.si.s_i. 特定元素m在大小为n的样本S中的概率为 P(m∈S)=1−P(m∉S)=1−∏1nP(si≠m)P(m∈S)=1−P(m∉S)=1−∏1nP(si≠m)P(m \in S) = 1 - P(m \notin S) = 1 - \prod_1^n P(s_i \neq m) =1−∏1n(1−Fi).=1−∏1n(1−Fi). = 1 - \prod_1^n(1 - F_i). 计算似乎表明,随着子间隔的长度变小,答案收敛到与第一种情况相同的数字(概率都相等)。sisis_i (对我而言)这似乎是违反直觉的,因为该构造似乎会抛出N的元素,而这些元素很少见,因此我希望数字小于.632。 而且,如果这是正确的,我想我们会 …

1
伊辛模型的吉布斯抽样
作业问题: 考虑一维伊辛模型。 令。x_i为-1或+1x=(x1,...xd)x=(x1,...xd)x = (x_1,...x_d)xixix_i π(x)∝e∑39i=1xixi+1π(x)∝e∑i=139xixi+1\pi(x) \propto e^{\sum_{i=1}^{39}x_ix_{i+1}} 设计一个gibbs采样算法,以大致根据目标分布\ pi(x)生成样本π(x)π(x)\pi(x)。 我的尝试: 随机选择值(-1或1)以填充向量x=(x1,...x40)x=(x1,...x40)x = (x_1,...x_{40})。所以x=(−1,−1,1,1,1,−1,1,1,...,1)x=(−1,−1,1,1,1,−1,1,1,...,1)x = (-1, -1, 1, 1, 1, -1, 1, 1,...,1)。所以这是x0x0x^0。 因此,现在我们需要继续进行第一次迭代。我们必须分别为x ^ 1绘制40个不同的x x1x1x^1。所以... 从\ pi(x_1 | x_2 ^ 0,...,x_ {40} ^ 0)中绘制x11x11x_1^1π(x1|x02,...,x040)π(x1|x20,...,x400)\pi(x_1 | x_2^0,...,x_{40}^0) 从\ pi(x_2 | x_1 ^ 1,x_3 ^ 0,...,x_ {40} ^ 0)中绘制x12x21x_2^1π(x2|x11,x03,...,x040)π(x2|x11,x30,...,x400)\pi(x_2 | …

1
回归系数的抽样分布
之前,我了解了采样分布,这些分布根据未知参数给出了供估计器使用的结果。例如,对于线性回归模型中和的采样分布β^0β^0\hat\beta_0β^1β^1\hat\beta_1Yi=βo+β1Xi+εiYi=βo+β1Xi+εiY_i = \beta_o + \beta_1 X_i + \varepsilon_i β^0∼N(β0, σ2(1n+x¯2Sxx))β^0∼N(β0, σ2(1n+x¯2Sxx)) \hat{\beta}_0 \sim \mathcal N \left(\beta_0,~\sigma^2\left(\frac{1}{n}+\frac{\bar{x}^2}{S_{xx}}\right)\right) 和 β^1∼N(β1, σ2Sxx)β^1∼N(β1, σ2Sxx) \hat{\beta}_1 \sim \mathcal N \left(\beta_1,~\frac{\sigma^2}{S_{xx}}\right) 其中Sxx=∑ni=1(x2i)−nx¯2Sxx=∑i=1n(xi2)−nx¯2S_{xx} = \sum_{i=1}^n (x_i^2) -n \bar{x}^2 但是现在我在书中看到了以下内容: 假设我们以通常的方式用最小二乘法拟合模型。考虑贝叶斯后验分布,并选择先验,这样就等于通常的常客抽样分布,即…… (β0β1)∼N2[(β^1β^2), σ^2(n∑ni=1xi∑ni=1xi∑ni=1x2i)−1](β0β1)∼N2[(β^1β^2), σ^2(n∑i=1nxi∑i=1nxi∑i=1nxi2)−1] \left( \begin{matrix} \beta_0 \\ \beta_1 \end{matrix} \right) \sim \mathcal N_2\left[\left(\begin{matrix} \hat{\beta}_1 \\ \hat{\beta}_2 \end{matrix} …

2
在R randomForest中进行替换采样
randomForest实现不允许采样超过观察次数,即使使用替换采样也是如此。为什么是这样? 工作正常: rf <- randomForest(Species ~ ., iris, sampsize=c(1, 1, 1), replace=TRUE) rf <- randomForest(Species ~ ., iris, sampsize=3, replace=TRUE) 我想做的事: rf <- randomForest(Species ~ ., iris, sampsize=c(51, 1, 1), replace=TRUE) Error in randomForest.default(m, y, ...) : sampsize can not be larger than class frequency 没有分层样本的类似错误: rf <- randomForest(Species ~ …


5
我可以将样本中的“左眼”和“右眼”用作两个不同的主题吗?
我的数据如下。我有两组病人。每组患者均进行了不同类型的眼科手术。在每组患者中测量了5个变量。我想使用置换检验或MANOVA比较两组之间的变量。进行分析的眼睛在分析中并不重要。但是,例如,A组的患者2在两只眼睛上都进行了手术,因此对这5个变量进行了两次测量,每只眼睛一次。我可以将患者2左和患者2右视为两个不同的观察结果吗?B组中的患者31相同。 Patient122.313132.Surgery typeAAA.BBB.SideLeftLeftRight.LeftRightRight.V1918790908891…………………V5221923171924PatientSurgery typeSideV1…V51ALeft91…222ALeft87…192ARight90…23...31BLeft90…1731BRight88…1932BRight91…24... \begin{array} \hline \text{Patient} & \text{Surgery type} & \text{Side} & \text{V1}& \ldots & V5\\ 1 & \text{A} & \text{Left} & 91 & \ldots & 22\\ 2 & \text{A} & \text{Left} & 87 & \ldots & 19\\ 2 & \text{A} & \text{Right} & 90 & \ldots & 23\\ …
11 sampling 


4
如何从内核密度估计中随机得出一个值?
我有一些观察结果,我想根据这些观察结果进行抽样。这里我考虑一个非参数模型,具体地说,我使用核平滑法从有限的观察值估计CDF。然后我从获得的CDF中随机绘制值。以下是我的代码(其思想是随机获得使用均匀分布的概率,并取CDF相对于概率值的倒数) x = [randn(100, 1); rand(100, 1)+4; rand(100, 1)+8]; [f, xi] = ksdensity(x, 'Function', 'cdf', 'NUmPoints', 300); cdf = [xi', f']; nbsamp = 100; rndval = zeros(nbsamp, 1); for i = 1:nbsamp p = rand; [~, idx] = sort(abs(cdf(:, 2) - p)); rndval(i, 1) = cdf(idx(1), 1); end figure(1); hist(x, …

2
简单证明吗?
令为独立的标准正态随机变量。有很多(冗长的)证明,表明Z1,⋯,ZnZ1,⋯,ZnZ_1,\cdots,Z_n ∑i=1n(Zi−1n∑j=1nZj)2∼χ2n−1∑i=1n(Zi−1n∑j=1nZj)2∼χn−12 \sum_{i=1}^n \left(Z_i - \frac{1}{n}\sum_{j=1}^n Z_j \right)^2 \sim \chi^2_{n-1} 许多证明都很长,其中一些证明使用归纳法(例如Casella Statistics Inference)。我想知道是否有任何容易证明这一结果的证据。


2
排序列表上的分布
说我们有一个有序的物品清单 [a, b, c, ... x, y, z, ...] 我正在寻找一个上面的列表中受某些参数alpha控制的发行版系列,以便: 对于alpha = 0,它将第一项的概率分配为1,将其分配给上方,将其余的分配为0。也就是说,如果我们从此列表中进行采样并进行替换,则总会得到a。 随着alpha的增加,我们会按照指数衰减的方式,为列表的其余部分分配越来越高的概率,并遵守列表的顺序。 当alpha = 1时,我们为列表中的所有项目分配相等的概率,因此从列表中进行采样类似于忽略其顺序。 这与几何分布非常相似,但是有一些明显的区别: 在所有自然数上定义了几何分布分布。在上面的例子中,列表的大小是固定的。 没有为alpha = 0定义几何分布。

2
什么是随机变量的样本?
随机变量被定义为从具有基础度量一个代数到另一个代数的可测量函数。XXXσσ\sigma(Ω1,F1)(Ω1,F1)(\Omega_1, \mathcal F_1)PPPσσ\sigma(Ω2,F2)(Ω2,F2)(\Omega_2, \mathcal F_2) 我们如何谈论这个随机变量的样本?我们是否将其视为的元素?还是与具有相同的可测量功能?XnXnX^nΩ2Ω2\Omega_2XXX 我在哪里可以了解更多信息? 例: 在蒙特卡洛估计中,我们通过将样本作为函数来证明估计量的无偏性。如果将随机变量的期望定义为(Xn)Nn=1(Xn)n=1N(X^n)_{n = 1}^NXXX E[X]=∫Ω1X(ω1)dP(ω1)E[X]=∫Ω1X(ω1)dP(ω1)\begin{align} \mathbb E[X] = \int_{\Omega_1} X(\omega_1) \,\mathrm dP(\omega_1) \end{align} 并假设是函数并且,我们可以进行如下操作:XnXnX^nXn=XXn=XX^n = X E[1N∑n=1Nf(Xn)]=1N∑n=1NE[f(Xn)]=1N∑n=1NE[f(X)]=E[f(X)].E[1N∑n=1Nf(Xn)]=1N∑n=1NE[f(Xn)]=1N∑n=1NE[f(X)]=E[f(X)].\begin{align} \mathbb E\left[\frac{1}{N} \sum_{n = 1}^N f(X^n)\right] &= \frac{1}{N} \sum_{n = 1}^N \mathbb E[f(X^n)] \\ &= \frac{1}{N} \sum_{n = 1}^N \mathbb E[f(X)] \\ &= \mathbb E[f(X)]. \end{align} …

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.