Questions tagged «uniform»

均匀分布描述了一个随机变量,该变量在其样本空间中同样可能取任意值。

2
统一随机变量作为两个随机变量之和
取自Grimmet和Stirzaker: 证明不可能不是U = X + Y的情况,U=X+YU=X+Y其中UUU在[0,1]上均匀分布,而XXX和YYY是独立且均匀分布的。您不应假定X和Y是连续变量。 一个简单的反证法足够了,其中的情况下XXX,ÿYY假定离散通过认为它总是能够找到一个üuu和ü 'u′u',使得P (û ≤ û + Ù ')≥ P (Ú ≤ Û )P(U≤u+u′)≥P(U≤u)P(U\leq u+u') \geq P(U\leq u)而P (X + ÿ ≤ Ù )= P (X + ý ≤ ü + Ú ')P(X+Y≤u)=P(X+Y≤u+u′)P(X+Y \leq u) = P(X+Y \leq u+u')。 但是,该证明不能扩展到X ,YX,YX,Y绝对连续或奇异连续。提示/评论/评论?

4
使用公平d6 独立且均匀地从1到随机绘制整数吗?
我希望通过滚动一定数量的六面骰子(d6)从1到某个特定绘制整数。一个很好的答案将解释为什么其方法会生成统一且独立的整数。ñNN 作为说明性示例,解释的情况下解决方案的工作方式将很有帮助。N = 150N=150N=150 此外,我希望该过程尽可能高效:为生成的每个数字平均滚动最少的d6数。 从senary到十进制的转换是允许的。 这个问题的灵感来自这个Meta线程。

2
为什么样本的CDF均匀分布
我在这里读到,给定样本来自cdf的连续分布,该样本对应于X1,X2,...,XnX1,X2,...,Xn X_1,X_2,...,X_n FXFX F_X Ui=FX(Xi)Ui=FX(Xi) U_i = F_X(X_i) 遵循标准均匀分布。 我已经使用Python中的定性模拟对此进行了验证,并且我很容易就能验证这种关系。 import matplotlib.pyplot as plt import scipy.stats xs = scipy.stats.norm.rvs(5, 2, 10000) fig, axes = plt.subplots(1, 2, figsize=(9, 3)) axes[0].hist(xs, bins=50) axes[0].set_title("Samples") axes[1].hist( scipy.stats.norm.cdf(xs, 5, 2), bins=50 ) axes[1].set_title("CDF(samples)") 结果如下图: 我无法理解为什么会这样。我认为这与CDF的定义及其与PDF的关系有关,但是我缺少一些东西... 如果有人可以指点我阅读有关该主题的文章或帮助我获得对该主题的直觉,我将不胜感激。 编辑:CDF看起来像这样:
17 pdf  uniform  cdf  intuition 

2
的分布是什么
我有四个独立的均匀分布的变量a,b,c,da,b,c,da,b,c,d中,每个在 [0,1][0,1][0,1]。我想计算(a−d)2+4bc(a−d)2+4bc(a-d)^2+4bc。我计算的分布u2=4bcu2=4bcu_2=4bc是(因此),并且的等于f2(u2)=−14lnu24f2(u2)=−14ln⁡u24f_2(u_2)=-\frac{1}{4}\ln\frac{u_2}{4}u2∈(0,4]u2∈(0,4]u_2\in(0,4]u1=(a−d)2u1=(a−d)2u_1=(a-d)^2f1(u1)=1−u1−−√u1−−√.f1(u1)=1−u1u1.f_1(u_1)=\frac{1-\sqrt{u_1}}{\sqrt{u_1}}.现在,总和的分布为(也独立)因为。这里必须是因此积分等于现在我将其插入Mathematica并得到u1+u2u1+u2u_1+u_2u1,u2u1,u2u_1,\, u_2fu1+u2(x)=∫+∞−∞f1(x−y)f2(y)dy=−14∫401−x−y−−−−√x−y−−−−√⋅lny4dy,fu1+u2(x)=∫−∞+∞f1(x−y)f2(y)dy=−14∫041−x−yx−y⋅ln⁡y4dy,f_{u_1+u_2}(x)=\int_{-\infty}^{+\infty}f_1(x-y)f_2(y)dy=-\frac{1}{4}\int_0^4\frac{1-\sqrt{x-y}}{\sqrt{x-y}}\cdot\ln\frac{y}{4}dy,y∈(0,4]y∈(0,4]y\in(0,4]x>yx>yx>yfu1+u2(x)=−14∫x01−x−y−−−−√x−y−−−−√⋅lny4dy.fu1+u2(x)=−14∫0x1−x−yx−y⋅ln⁡y4dy.f_{u_1+u_2}(x)=-\frac{1}{4}\int_0^{x}\frac{1-\sqrt{x-y}}{\sqrt{x-y}}\cdot\ln\frac{y}{4}dy.fu1+u2(x)=14[−x+xlnx4−2x−−√(−2+lnx)].fu1+u2(x)=14[−x+xln⁡x4−2x(−2+ln⁡x)].f_{u_1+u_2}(x)=\frac{1}{4}\left[-x+x\ln\frac{x}{4}-2\sqrt{x}\left(-2+\ln x\right)\right]. 我制作了四个独立的集合,每个集合分别由数字组成,并绘制了的直方图:a,b,c,da,b,c,da,b,c,d10610610^6(a−d)2+4bc(a−d)2+4bc(a-d)^2+4bc 并绘制了:fu1+u2(x)fu1+u2(x)f_{u_1+u_2}(x) 通常,该图与直方图相似,但在区间大部分为负(根在​​2.27034处)。正部分的积分。(0,5)(0,5)(0,5)≈0.77≈0.77\approx 0.77 哪里错了?或者我在哪里缺少什么? 编辑:我缩放直方图以显示PDF。 编辑2:我想我知道推理的问题所在-集成限制。因为和,所以我不能简单地。该图显示了我必须集成的区域:y∈(0,4]y∈(0,4]y\in (0,4]x−y∈(0,1]x−y∈(0,1]x-y\in(0,1]∫x0∫0x\int_0^x 这意味着我有为(这就是为什么我的一部分是正确的),中和 in。不幸的是,Mathematica无法计算后两个积分(嗯,它的确计算了第二个积分,因为输出中有一个虚构的单位会破坏一切... )。 Ý ∈ (0 ,1 ] ˚F ∫ X X - 1个 Ÿ ∈ (1 ,4 ] ∫ 4 X - 1 Ÿ ∈ (4 ,5 ]∫x0∫0x\int_0^xy∈(0,1]y∈(0,1]y\in(0,1]fff∫xx−1∫x−1x\int_{x-1}^xy∈(1,4]y∈(1,4]y\in(1,4]∫4x−1∫x−14\int_{x-1}^4y∈(4,5]y∈(4,5]y\in (4,5] 编辑3:看来Mathematica可以使用以下代码计算最后三个积分: (1/4)*Integrate[((1-Sqrt[u1-u2])*Log[4/u2])/Sqrt[u1-u2],{u2,0,u1}, Assumptions ->0 <= u2 <= u1 …

1
在原假设下模拟二项式检验时p值的非均匀分布
我听说在零假设下,p值分布应该是均匀的。但是,在MATLAB中进行二项式检验的仿真返回的均值分布与均值大于0.5(在这种情况下为0.518)的差异非常大: coin = [0 1]; success_vec = nan(20000,1); for i = 1:20000 success = 0; for j = 1:200 success = success + coin(randperm(2,1)); end success_vec(i) = success; end p_vec = binocdf(success_vec,200,0.5); hist(p_vec); 尝试更改生成随机数的方式无济于事。我真的很感谢在这里的任何解释。

1
离散均匀分布中未替换的样本之间的最大间隙
这个问题与我实验室对机器人覆盖率的研究有关: 随机绘制Ñnn从组数字{ 1 ,2 ,... ,米}{1,2,…,m}\{1,2,\ldots,m\}无需更换,并以升序排序的数字。 。1 ≤ Ñ ≤ 米1≤n≤m1\le n\le m 从此排序的数字,生成连续数字和边界之间的差:。这给出了间隙。{ 一(1 ),一个(2 ),... ,一个(Ñ ) } {a(1),a(2),…,a(n)}\{a_{(1)},a_{(2)},…,a_{(n)}\}克= { 一(1 ),一个(2 ) - 一(1 ),... ,一个(Ñ ) - 一(ñ - 1 ),m + 1 - a (n ) } g={a(1),a(2)−a(1),…,a(n)−a(n−1),m+1−a(n)}g = \{a_{(1)},a_{(2)}−a_{(1)},\ldots,a_{(n)}−a_{(n-1)},m+1-a_{(n)}\}n +1个n+1n+1 最大差距的分布是什么? P (max (g …

1
从自定义分布生成随机样本
我正在尝试使用R从自定义pdf生成随机样本。我的pdf是: fX(x)=32(1−x2),0≤x≤1fX(x)=32(1−x2),0≤x≤1f_{X}(x) = \frac{3}{2} (1-x^2), 0 \le x \le 1 我生成了统一的样本,然后尝试将其转换为我的自定义发行版。我通过找到分布的cdf(FX(x)FX(x)F_{X}(x))并将其设置为统一样本(uuu)并求解xxx。 FX(x)=Pr[X≤x]=∫x032(1−y2)dy=32(x−x33)FX(x)=Pr[X≤x]=∫0x32(1−y2)dy=32(x−x33) F_{X}(x) = \Pr[X \le x] = \int_{0}^{x} \frac{3}{2} (1-y^2) dy = \frac{3}{2} (x - \frac{x^3}{3}) 为了生成与上述分布的随机样本,得到均匀的样品和求解X在3u∈[0,1]u∈[0,1]u \in[0,1]xxx32(x−x33)=u32(x−x33)=u\frac{3}{2} (x - \frac{x^3}{3}) = u 我实现了它,R但没有得到预期的分布。谁能指出我的理解上的缺陷? nsamples <- 1000; x <- runif(nsamples); f <- function(x, u) { return(3/2*(x-x^3/3) - u); } …
16 r  sampling  uniform 

1
Box-Muller与逆CDF方法相比在模拟正态分布方面的优势?
为了从一组均匀变量中模拟正态分布,有几种技术: Box-Muller算法,其中一个对上的两个独立均匀变量进行采样,然后通过以下方法将它们转换为两个独立的标准正态分布: Ž 0 = √(0,1)(0,1)(0,1)Z0=−2lnU1−−−−−−√cos(2πU0)Z1=−2lnU1−−−−−−√sin(2πU0)Z0=−2lnU1cos(2πU0)Z1=−2lnU1sin(2πU0) Z_0 = \sqrt{-2\text{ln}U_1}\text{cos}(2\pi U_0)\\ Z_1 = \sqrt{-2\text{ln}U_1}\text{sin}(2\pi U_0) CDF方法,其中可以将普通cdf等同于一个统一变量: 并得出 F (Z )= U Z = F − 1(U )(F(Z))(F(ž))(F(Z))F(Z)= UF(ž)=ü F(Z) = U ž= F− 1(U)ž=F-1(ü)Z = F^{-1}(U) 我的问题是:哪个计算效率更高?我认为这是后者的方法-但是我阅读的大多数论文都使用Box-Muller-为什么? 附加信息: 正常CDF的逆是已知的,并给出: F− 1(Z)=2–√埃尔夫− 1(2Z−1),Z∈(0,1).F−1(Z)=2erf−1⁡(2Z−1),Z∈(0,1).F^{-1}(Z)\; =\; \sqrt2\;\operatorname{erf}^{-1}(2Z - 1), \quad Z\in(0,1). 因此: Z=F−1(U)=2–√erf−1(2U−1),U∈(0,1).Z=F−1(U)=2erf−1⁡(2U−1),U∈(0,1). Z …

2
使用正态分布的图形模拟均匀分布的图形
我最近购买了一个数据科学面试资源,其中一个概率问题如下: 给定具有已知参数的正态分布的绘图,如何模拟均匀分布的绘图? 我最初的想法是,对于离散随机变量,我们可以将正态分布分解为K个唯一的子部分,其中每个子部分在正态曲线下的面积均相等。然后,我们可以通过识别变量最终落入法线曲线的哪个区域来确定该变量取K个值。 但这仅适用于离散随机变量。我研究了如何对连续随机变量执行相同的操作,但是不幸的是,我只能找到诸如逆变换采样之类的技术,这些技术将使用统一随机变量作为输入,并且可以从其他分布中输出随机变量。我在想,也许我们可以反向进行此过程以获得统一的随机变量? 我还考虑过可能使用Normal随机变量作为线性同余生成器的输入,但是我不确定这是否可行。 关于如何处理这个问题有任何想法吗?

1
在原假设下,可交换样本背后的直觉是什么?
排列检验(也称为随机检验,重新随机检验或精确检验)非常有用,并且在t-test未满足例如要求的正态分布的假设以及通过按等级对值进行转换时派上用场非参数测试之类的测试Mann-Whitney-U-test会导致丢失更多信息。但是,在使用这种检验时,一个假设且唯一一个假设应该是原假设下样本的可交换性假设。还值得注意的是,当有两个以上的示例(如在coinR包中实现的示例)时,也可以应用这种方法。 您能用简单的英语用一些比喻语言或概念直觉来说明这一假设吗?这对于在像我这样的非统计学家中阐明这个被忽视的问题非常有用。 注意: 提及在相同假设下应用置换测试不成立或无效的情况将非常有帮助。 更新: 假设我随机从我所在地区的当地诊所收集了50个受试者。他们被随机分配为接受药物或安慰剂的比例为1:1。分别Par1在V1(基准),V2(3个月后)和V3(1年后)时测量了参数1 。根据特征A,所有50个主题都可以分为2组;正值= 20,负值=30。它们也可以基于特征B细分为另外2组;B阳性= 15,B阴性=35。 现在,我具有Par1所有访问中所有受试者的值。在可交换性的假设下,如果可以,我是否可以在Par1使用置换测试的水平之间进行比较: -将接受药物治疗的受试者与接受V2安慰剂治疗的受试者进行比较? -将具有特征A的对象与具有V2的特征B的对象进行比较? -比较在V2具有特征A的对象与在V3具有特征A的对象? -在哪种情况下,这种比较是无效的,并且违反了可交换性的假设?
15 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

2
生成三个相关的均匀分布的随机变量
假设我们有 X1∼unif(n,0,1),X1∼unif(n,0,1),X_1 \sim \textrm{unif}(n,0,1), X2∼unif(n,0,1),X2∼unif(n,0,1),X_2 \sim \textrm{unif}(n,0,1), 其中unif(n,0,1)unif(n,0,1)\textrm{unif}(n,0,1)是大小均匀的随机样本n,和 Y=X1,Y=X1,Y=X_1, Z=0.4X1+1−0.4−−−−−−√X2.Z=0.4X1+1−0.4X2.Z = 0.4 X_1 + \sqrt{1 - 0.4}X_2. 那么,YYY和的相关性ZžZ为0.40.40.4。 如何将其扩展到三个变量:X1X1个X_1,X2X2X_2,X3X3X_3?


3
为什么(0,1)上连续和变量的总和要超过1的数量均具有平均值
让我们总结随机变量,流X 我我我d 〜 ù(0 ,1 )Xi∼iidU(0,1)X_i \overset{iid}\sim \mathcal{U}(0,1) ; 令YYY为总数需要超过1的项的数量,即YYY是最小的项,使得 X 1 + X 2 + ⋯ + X Y > 1。X1+X2+⋯+XY>1.X_1 + X_2 + \dots + X_Y > 1. 为什么Y的均值YY等于欧拉常数eee? E(Y )= e = 10 !+11 !+12 !+13 !+…E(Y)=e=10!+11!+12!+13!+…\mathbb{E}(Y) = e = \frac{1}{0!} + \frac{1}{1!} + \frac{1}{2!} + \frac{1}{3!} …

3
生成均匀分布和相关的随机数对
我想生成一对具有一定相关性的随机数。但是,使用两个正态变量的线性组合的常用方法在这里无效,因为均匀变量的线性组合不再是均匀分布的变量。我需要两个变量要统一。 关于如何生成具有给定相关性的统一变量对的任何想法?

2
离散均匀随机变量(?),在封闭区间内取所有有理值
我刚刚发生了(智力)恐慌发作。 一个连续的随机变量,它在一个封闭的间隔中遵循统一:这是一种非常熟悉的统计概念。 ü(a ,b )U(a,b)U(a,b) 在扩展的实数(一半或整个)上具有支持的连续均匀rv:不是rv固有的,而是基本贝叶斯概念,用于不适当的先验,有用和适用。 一个离散的统一值,其值是有限的:让我们扔一个测地线圆顶,没什么大不了的。 但是,一个函数具有一个以整数为界的封闭区间中包含的所有有理数(如果需要,以开头)的函数呢?我们想在概率框架中使用它,要求每个可能值与所有其他值都具有相等的概率吗?[ 0 ,1 ][0,1][0,1] 可能值的数量是无穷大的(表征许多离散分布),但是如果我们希望概率相等,那么如何表达单个值的概率呢? 我们能否说出证明这种实体是(不是)随机变量? 如果不是,这是否是“不当先验”的又一个化身(也许已经众所周知)? 这个实体在某种意义上是否可能定义为连续统一rv的“等效”(无论多么特别)?还是我只是犯了一个基本罪? 似乎该域是一个封闭的间隔这一事实并不能让我放手。有界的东西通常是可管理的。 为了指示内部漩涡,问题很多。我不是要得到每个问题的答案。 在任何时候,如果我想出任何见解,我都会进行更新。 更新:目前的问题在这里刚刚获得了一个建构主义的续集。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.