Questions tagged «random-variable»

随机变量或随机变量是受到偶然变化(即,数学意义上的随机性)影响的值。




1
社区对第四象限的看法是什么?
黑天鹅名人(或臭名昭著)的纳西姆·塔莱布(Nassim Taleb )详细阐述了这一概念,并开发了他所谓的“统计极限图”。他的基本论点是,存在一种决策问题,任何统计模型的使用都是有害的。这些都是决策问题,决策错误的后果可能过高,而且基本的PDF很难理解。 一个例子是做空股票期权。这种操作可能导致无限(至少在理论上)损失;而且这种损失的可能性尚不清楚。实际上,很多人都为概率建模,但塔勒布(Taleb)认为,金融市场还不够成熟,不足以让人们对任何模型都充满信心。仅仅因为您见过的每只天鹅都是白色,并不意味着黑天鹅是不可能甚至不可能的。 这就是问题所在:统计界是否就塔莱布的论点达成共识? 也许这应该是社区Wiki。我不知道。



5
统计学家为什么要定义随机矩阵?
我十年前学习数学,所以我有数学和统计学背景,但是这个问题使我丧命。 这个问题对我来说仍然有点哲学。为什么统计学家开发各种技术以处理随机矩阵?我的意思是,随机向量不能解决问题吗?如果不是,那么随机矩阵的不同列的平均值是多少?Anderson(2003,Wiley)认为随机向量是只有一列的随机矩阵的特例。 我看不到具有随机矩阵的意义(而且我敢肯定那是因为我很无知)。但是,忍受我。想象一下,我有一个包含20个随机变量的模型。如果要计算联合概率函数,为什么要将它们描绘成矩阵而不是向量? 我想念什么? ps:很抱歉,您对这个问题的标签打的不好,但是没有随机矩阵的标签,我还不能创建一个! 编辑:将矩阵更改为标题中的矩阵


2
统一随机变量作为两个随机变量之和
取自Grimmet和Stirzaker: 证明不可能不是U = X + Y的情况,U=X+YU=X+Y其中UUU在[0,1]上均匀分布,而XXX和YYY是独立且均匀分布的。您不应假定X和Y是连续变量。 一个简单的反证法足够了,其中的情况下XXX,ÿYY假定离散通过认为它总是能够找到一个üuu和ü 'u′u',使得P (û ≤ û + Ù ')≥ P (Ú ≤ Û )P(U≤u+u′)≥P(U≤u)P(U\leq u+u') \geq P(U\leq u)而P (X + ÿ ≤ Ù )= P (X + ý ≤ ü + Ú ')P(X+Y≤u)=P(X+Y≤u+u′)P(X+Y \leq u) = P(X+Y \leq u+u')。 但是,该证明不能扩展到X ,YX,YX,Y绝对连续或奇异连续。提示/评论/评论?

1
用给定的MLE模拟随机样本
这个交叉验证问题要求模拟一个以固定金额为条件的样本,使我想起了乔治•卡塞拉(George Casella)提出的一个问题。 f(x|θ)f(x|θ)f(x|\theta)(X1,…,Xn)(X1,…,Xn)(X_1,\ldots,X_n)θθ\thetaθ^(x1,…,xn)=argmin∑i=1nlogf(xi|θ)θ^(x1,…,xn)=arg⁡min∑i=1nlog⁡f(xi|θ)\hat{\theta}(x_1,\ldots,x_n)=\arg\min \sum_{i=1}^n \log f(x_i|\theta)对于一个给定的值,有以模拟IID样品一个通用的方法上的MLE的值有条件?θθ\thetaθ(X 1,... ,X Ñ)(X1,…,Xn)(X1,…,Xn)(X_1,\ldots,X_n)θ^(X1,…,Xn)θ^(X1,…,Xn)\hat{\theta}(X_1,\ldots,X_n) 例如,采用分布,位置参数为,密度为如果我们如何以条件来模拟?在此示例中,没有封闭形式的表达式。T5T5\mathfrak{T}_5μμ\muf(x|μ)=Γ(3)Γ(1/2)Γ(5/2)[1+(x−μ)2/5]−3f(x|μ)=Γ(3)Γ(1/2)Γ(5/2)[1+(x−μ)2/5]−3f(x|\mu)=\dfrac{\Gamma(3)}{\Gamma(1/2)\Gamma(5/2)}\,\left[1+(x-\mu)^2/5\right]^{-3}(X1,…,Xn)∼iidf(x|μ)(X1,…,Xn)∼iidf(x|μ)(X_1,\ldots,X_n)\stackrel{\text{iid}}{\sim} f(x|\mu)(X1,…,Xn)(X1,…,Xn)(X_1,\ldots,X_n)μ^(X1,…,Xn)=μ0μ^(X1,…,Xn)=μ0\hat{\mu}(X_1,\ldots,X_n)=\mu_0T5T5\mathfrak{T}_5μ^(X1,…,Xn)μ^(X1,…,Xn)\hat{\mu}(X_1,\ldots,X_n)

2
的分布是什么
我有四个独立的均匀分布的变量a,b,c,da,b,c,da,b,c,d中,每个在 [0,1][0,1][0,1]。我想计算(a−d)2+4bc(a−d)2+4bc(a-d)^2+4bc。我计算的分布u2=4bcu2=4bcu_2=4bc是(因此),并且的等于f2(u2)=−14lnu24f2(u2)=−14ln⁡u24f_2(u_2)=-\frac{1}{4}\ln\frac{u_2}{4}u2∈(0,4]u2∈(0,4]u_2\in(0,4]u1=(a−d)2u1=(a−d)2u_1=(a-d)^2f1(u1)=1−u1−−√u1−−√.f1(u1)=1−u1u1.f_1(u_1)=\frac{1-\sqrt{u_1}}{\sqrt{u_1}}.现在,总和的分布为(也独立)因为。这里必须是因此积分等于现在我将其插入Mathematica并得到u1+u2u1+u2u_1+u_2u1,u2u1,u2u_1,\, u_2fu1+u2(x)=∫+∞−∞f1(x−y)f2(y)dy=−14∫401−x−y−−−−√x−y−−−−√⋅lny4dy,fu1+u2(x)=∫−∞+∞f1(x−y)f2(y)dy=−14∫041−x−yx−y⋅ln⁡y4dy,f_{u_1+u_2}(x)=\int_{-\infty}^{+\infty}f_1(x-y)f_2(y)dy=-\frac{1}{4}\int_0^4\frac{1-\sqrt{x-y}}{\sqrt{x-y}}\cdot\ln\frac{y}{4}dy,y∈(0,4]y∈(0,4]y\in(0,4]x>yx>yx>yfu1+u2(x)=−14∫x01−x−y−−−−√x−y−−−−√⋅lny4dy.fu1+u2(x)=−14∫0x1−x−yx−y⋅ln⁡y4dy.f_{u_1+u_2}(x)=-\frac{1}{4}\int_0^{x}\frac{1-\sqrt{x-y}}{\sqrt{x-y}}\cdot\ln\frac{y}{4}dy.fu1+u2(x)=14[−x+xlnx4−2x−−√(−2+lnx)].fu1+u2(x)=14[−x+xln⁡x4−2x(−2+ln⁡x)].f_{u_1+u_2}(x)=\frac{1}{4}\left[-x+x\ln\frac{x}{4}-2\sqrt{x}\left(-2+\ln x\right)\right]. 我制作了四个独立的集合,每个集合分别由数字组成,并绘制了的直方图:a,b,c,da,b,c,da,b,c,d10610610^6(a−d)2+4bc(a−d)2+4bc(a-d)^2+4bc 并绘制了:fu1+u2(x)fu1+u2(x)f_{u_1+u_2}(x) 通常,该图与直方图相似,但在区间大部分为负(根在​​2.27034处)。正部分的积分。(0,5)(0,5)(0,5)≈0.77≈0.77\approx 0.77 哪里错了?或者我在哪里缺少什么? 编辑:我缩放直方图以显示PDF。 编辑2:我想我知道推理的问题所在-集成限制。因为和,所以我不能简单地。该图显示了我必须集成的区域:y∈(0,4]y∈(0,4]y\in (0,4]x−y∈(0,1]x−y∈(0,1]x-y\in(0,1]∫x0∫0x\int_0^x 这意味着我有为(这就是为什么我的一部分是正确的),中和 in。不幸的是,Mathematica无法计算后两个积分(嗯,它的确计算了第二个积分,因为输出中有一个虚构的单位会破坏一切... )。 Ý ∈ (0 ,1 ] ˚F ∫ X X - 1个 Ÿ ∈ (1 ,4 ] ∫ 4 X - 1 Ÿ ∈ (4 ,5 ]∫x0∫0x\int_0^xy∈(0,1]y∈(0,1]y\in(0,1]fff∫xx−1∫x−1x\int_{x-1}^xy∈(1,4]y∈(1,4]y\in(1,4]∫4x−1∫x−14\int_{x-1}^4y∈(4,5]y∈(4,5]y\in (4,5] 编辑3:看来Mathematica可以使用以下代码计算最后三个积分: (1/4)*Integrate[((1-Sqrt[u1-u2])*Log[4/u2])/Sqrt[u1-u2],{u2,0,u1}, Assumptions ->0 <= u2 <= u1 …

3
“测试统计”是值还是随机变量?
我是一名正在上我的第一门统计学课程的学生。我对“测试统计”一词感到困惑。 在下面的内容中(我在一些教科书中看到了这一点),似乎是根据特定样本计算得出的特定值。 吨= ¯ X - μ 0ŤŤtt = x¯¯¯- μ0s / n--√Ť=X¯-μ0s/ñ t=\frac{\overline{x} - \mu_0}{s / \sqrt{n}} 但是,在下面的内容(我在其他一些教科书中也看到过)中,似乎是一个随机变量。 Ť = ¯ X - μ 0ŤŤTŤ= X¯¯¯¯- μ0小号/ n--√Ť=X¯-μ0小号/ñ T=\frac{\overline{X} - \mu_0}{S / \sqrt{n}} 那么,“测试统计”一词是指特定值还是随机变量,或者两者都表示?

1
两个独立随机变量(正态和卡方)乘积的pdf
如果X和Y是独立的,则两个独立的随机变量X和Y的乘积的pdf是多少?X是正态分布,Y是卡方分布。 Z = XY 如果XXX具有正态分布X∼N(μx,σ2x)X∼N(μx,σx2)X\sim N(\mu_x,\sigma_x^2) fX(x)=1σx2π−−√e−12(x−μxσx)2fX(x)=1σx2πe−12(x−μxσx)2f_X(x)={1\over\sigma_x\sqrt{2\pi}}e^{-{1\over2}({x-\mu_x\over\sigma_x})^2} 和YYY具有卡方分布自由度 whre是单位阶跃函数。kkkY∼χ2kY∼χk2Y\sim \chi_k^2 fY(y)=y(k/2)−1e−y/22k/2Γ(k2)u(y)fY(y)=y(k/2)−1e−y/22k/2Γ(k2)u(y)f_Y(y)={y^{(k/2)-1}e^{-y/2}\over{2^{k/2}\Gamma({k\over2})}}u(y)u(y)u(y)u(y) 现在,如果X和Y独立,则的pdf 是多少?ZZZXXXYYY 找到解决方案的一种方法是使用Rohatgi的著名结果(1976,p.141),如果fXY(x,y)fXY(x,y)f_{XY}(x,y)是连续RV XXX和Y的联合pdf YYY,则Z的pdf ZZZ是 fZ(z)=∫∞−∞1|y|fXY(zy,y)dyfZ(z)=∫−∞∞1|y|fXY(zy,y)dyf_Z(z) = \int_{-\infty}^{\infty}{{1\over|y|}f_{XY}({z\over y},y)dy} 由于和是独立的 我们面临解决积分。谁能帮助我解决这个问题。ÿ ˚F X Ý(X ,ÿ )= ˚F X(X )˚F Ý(Ý )˚F Ž(ż )= ∫ ∞ - ∞ 1XXXYYYfXY(x,y)=fX(x)fY(y)fXY(x,y)=fX(x)fY(y)f_{XY}(x,y)=f_X(x)f_Y(y) fZ(z)=∫∞−∞1|y|fX(zy)fY(y)dyfZ(z)=∫−∞∞1|y|fX(zy)fY(y)dyf_Z(z) = \int_{-\infty}^{\infty}{{1\over|y|}f_{X}({z\over y})f_{Y}(y)dy} ∫∞01fZ(z)=1σx2π−−√12k/2Γ(k2)∫∞01|y|e−12(zy−μxσx)2y(k/2)−1e−y/2dyfZ(z)=1σx2π12k/2Γ(k2)∫0∞1|y|e−12(zy−μxσx)2y(k/2)−1e−y/2dyf_Z(z) = {1\over\sigma_x\sqrt{2\pi}}{1\over{2^{k/2}\Gamma({k\over2})}}\int_{0}^{\infty}{{1\over|y|}e^{-{1\over2}({{z\over y}-\mu_x\over\sigma_x})^2} {y^{(k/2)-1}e^{-y/2}}dy} ∫∞01|y|e−12(zy−μxσx)2y(k/2)−1e−y/2dy∫0∞1|y|e−12(zy−μxσx)2y(k/2)−1e−y/2dy\int_{0}^{\infty}{{1\over|y|}e^{-{1\over2}({{z\over …

4
计算所需的样本量,方差估计的精度?
背景 我有一个未知分布的变量。 我有500个样本,但是我想证明我可以计算方差的精度,例如说500的样本量就足够了。我也想知道以的精度估算方差所需的最小样本量X%X%X\%。 问题 我该如何计算 给定样本量,我估计方差的精度n=500n=500n=500?的n=Nn=Nn=N? 如何计算以精度估算方差所需的最小样本数XXX? 例 图1基于500个样本的参数密度估计。 图2这是我使用500个样本的子样本计算出的x轴上的样本大小与y轴上的方差估计值之间的关系图。想法是随着n的增加,估计值将收敛到真实方差。 然而,估计是无效的独立自样品用于估计方差n∈[10,125,250,500]n∈[10,125,250,500]n \in [10,125,250,500]是不相互独立的或在用于计算方差的样本n∈[20,40,80]n∈[20,40,80]n\in [20,40,80]

1
随机变量及其分布的符号约定
我对正确的含义符号以及与随机变量及其分布有关的某些符号的含义感到困惑。在下面,我将列出我认为是正确的事情以及我不理解的事情,我会喜欢输入/更正。为了方便参考,我在每个问题/问题上都标了一个数字。如果在这样的单个问题中列出项目不合适,请告诉我。我以为可以,因为它们都很矮。 随机变量由一个大写字母,如记谱XXX。 对随机变量进行的运算是什么意思?(例如,您如何用词解释X 2X2X^2?)。 来自随机变量的特定绘图用小写字母(例如x)或带下标(例如x 1)的小写字母或带数字(例如X 1)的大写数字表示。xxx1x_1X1X_1 从随机变量X提取的n的k t h阶统计量的随机变量记为X k n。kthkthnnXXXknX_{kn} 是否有一种简便的方式写“ X是由F(x)分配的随机变量(或“ cdf F(x)”或“ B(a,b)”或任何表征分布的方式)”? 我可以写出E F (x )来表示根据F (xEF(x)\mathbb{E}F(x))吗?F(x)F(x) 如果我在变量X的累积分布函数进行操作,例如,˚F Ñ È 瓦特(X )= ˚F Ö 升d(X )2,以获得最大的2从绘制的CDF X,我可以谱写,在计X不知何故?Fnew(x)=Fold(x)2F_{new}(x) = F_{old}(x)^2XXXX 是简洁写出F 2(x )或F (x )2的(F (x ))2的适当方法(F(x))2(F(x))^2F2(x)F^2(x)F(x)2F(x)^2? 离散变量和连续变量之间在符号上有区别吗?

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.