Questions tagged «random-variable»

随机变量或随机变量是受到偶然变化(即,数学意义上的随机性)影响的值。


3
将离散随机变量减半?
让是一个离散随机变量采取它的值在Ñ。我想将该变量减半,即找到一个随机变量Y,例如:XXXNñ\mathbb{N}YÿY X=Y+Y∗X=ÿ+ÿ∗X = Y + Y^* 其中是一个独立的副本ÿ。Y∗ÿ∗Y^*YÿY 我指的是这个过程减半;这是一个虚构的术语。在文献中是否有合适的术语用于该手术? 在我看来,只有当我们接受负概率时,此类才会一直存在。我的观察正确吗?YÿY 有没有最好的概念正适合?又称随机变量,它是“最接近”求解上述方程式的变量。YÿY 谢谢!

1
如果是独立Beta,则显示也是beta
这是几年前在我们大学进行的学期考试中遇到的一个问题,我正在努力解决。 如果X1,X2X1,X2X_1,X_2是密度分别为\ beta(n_1,n_2)和\ beta(n_1 + \ dfrac {1} {2},n_2)的独立ββ\beta随机变量,则表明\ sqrt {X_1X_2}遵循\ beta(2n_1, 2n_2)。β(n1个,n2)β(ñ1个,ñ2)\beta(n_1,n_2)β(n1个+ 12,n2)β(ñ1个+1个2,ñ2)\beta(n_1+\dfrac{1}{2},n_2)X1个X2-----√X1个X2\sqrt{X_1X_2}β(2 n1个,2 n2)β(2ñ1个,2ñ2)\beta(2n_1,2n_2) 我使用Jacobian方法获得Y = \ sqrt {X_1X_2}的密度ÿ= X1个X2-----√ÿ=X1个X2Y=\sqrt{X_1X_2}如下: Fÿ(y)= 4 ÿ2 n1个乙(Ñ1个,n2)B (n1个+ 12,n2)∫1个ÿ1个X2(1 − x2)ñ2− 1(1 − y2X2)ñ2− 1dXFÿ(ÿ)=4ÿ2ñ1个乙(ñ1个,ñ2)乙(ñ1个+1个2,ñ2)∫ÿ1个1个X2(1个-X2)ñ2-1个(1个-ÿ2X2)ñ2-1个dXf_Y(y)=\dfrac{4y^{2n_1}}{B(n_1,n_2)B(n_1+\dfrac{1}{2},n_2)}\int_y^1\dfrac{1}{x^2}(1-x^2)^{n_2-1}(1-\dfrac{y^2}{x^2})^{n_2-1}dx 我实际上在这一点上迷路了。现在,在主文件中,我发现已经提供了提示。我尝试使用提示,但无法获得所需的表达式。提示逐字记录如下: 提示:根据给定的X_1和X_2密度,得出Y = \ sqrt {X_1X_2}的密度公式,并尝试使用z = \ dfrac {y ^ 2} {x}的变量更改。ÿ= X1个X2-----√ÿ=X1个X2Y=\sqrt{X_1X_2}X1个X1个X_1X2X2X_2ž= y2Xž=ÿ2Xz=\dfrac{y^2}{x} 因此,在这一点上,我尝试通过考虑变量的这种变化来利用此提示。因此我得到Fÿ(y)= …

2
IID随机变量和的商的期望(剑桥大学工作表)
我正在准备一个面试,要求对基础概率有相当的了解(至少要通过面试本身)。从学生时代开始,我正在整理以下表格。这通常是相当简单的,但是我完全被问题12困扰。 http://www.trin.cam.ac.uk/dpk10/IA/exsheet2.pdf 任何帮助,将不胜感激。 编辑:问题是: 假设是具有和独立均匀分布的正随机变量。令。显示当时,并且时。X1个,X2,。。。X1,X2,...X_1, X_2, ... E(X1个)= μ &lt; ∞E(X1)=μ&lt;∞\mathbb{E}(X_1) = \mu < \inftyE(X− 11个)&lt; ∞E(X1−1)&lt;∞\mathbb{E}(X_1^{-1}) < \infty小号ñ=∑ñ我= 1X一世Sn=∑i=1nXiS_n = \sum_{i=1}^n X_iE(小号米/小号ñ)= m / nE(Sm/Sn)=m/n\mathbb{E}(S_m/S_n) = m/nm &lt; = nm&lt;=nm<=nE(小号米/小号ñ)= 1 + (米- ñ )μ È(小号− 1ñ))E(Sm/Sn)=1+(m−n)μE(Sn−1))\mathbb{E}(S_m/S_n) = 1 + (m-n)\mu\mathbb{E}(S_n^{-1}))m &gt; = n米&gt; =ñm>=n 实际上,在键入内容的过程中,我已经解决了第二部分。 对于,m &gt; = …

3
Rademacher随机变量的乘积和
令是独立随机变量,其值分别为或,概率分别为0.5。考虑和。我希望将概率上限。我现在的最佳界限是,其中c是一个通用常数。这是通过应用简单的Chernoff 边界对概率Pr(| x_1 + \ dots + x_n | &lt;\ sqrt {t})和Pr(| y_1 + \ dots y_n | &lt;\ sqrt {t})进行下限来实现的。我能希望得到比这个界限更好的东西吗?首先,我至少可以得到x1…xa,y1…ybx1…xa,y1…ybx_1 \ldots x_a,y_1 \ldots y_b+1+1+1−1−1-1S=∑i,jxi×yjS=∑i,jxi×yjS = \sum_{i,j} x_i\times y_jP(|S|&gt;t)P(|S|&gt;t)P(|S| > t)2e−ctmax(a,b)2e−ctmax(a,b)2e^{-\frac{ct}{\max(a,b)}}cccPr(|x1+⋯+xn|&lt;t√)Pr(|x1+⋯+xn|&lt;t)Pr(|x_1 + \dots + x_n|<\sqrt{t})Pr(|y1+⋯+yn|&lt;t√)Pr(|y1+⋯+yn|&lt;t)Pr(|y_1 + \dots + y_n|<\sqrt{t})e−ctab√e−ctabe^{-c\frac{t}{\sqrt{ab}}}。如果我可以得到次高斯的尾巴,那可能是最好的,但是我们可以期望吗(我不这样认为,但也不能想到一个论点)?

2
混合模型的参数,半参数和非参数引导
接下来的嫁接摘自本文。我是新手,要引导并尝试为带有R boot包的线性混合模型实现参数,半参数和非参数自举。 R代码 这是我的R代码: library(SASmixed) library(lme4) library(boot) fm1Cult &lt;- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=Cultivation) fixef(fm1Cult) boot.fn &lt;- function(data, indices){ data &lt;- data[indices, ] mod &lt;- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=data) fixef(mod) } set.seed(12345) Out &lt;- boot(data=Cultivation, statistic=boot.fn, R=99) Out 问题 …
9 r  mixed-model  bootstrap  central-limit-theorem  stable-distribution  time-series  hypothesis-testing  markov-process  r  correlation  categorical-data  association-measure  meta-analysis  r  anova  confidence-interval  lm  r  bayesian  multilevel-analysis  logit  regression  logistic  least-squares  eda  regression  notation  distributions  random-variable  expected-value  distributions  markov-process  hidden-markov-model  r  variance  group-differences  microarray  r  descriptive-statistics  machine-learning  references  r  regression  r  categorical-data  random-forest  data-transformation  data-visualization  interactive-visualization  binomial  beta-distribution  time-series  forecasting  logistic  arima  beta-regression  r  time-series  seasonality  large-data  unevenly-spaced-time-series  correlation  statistical-significance  normalization  population  group-differences  demography 

2
如何为相关数据建模伯努利随机变量的总和?
我有几乎相同的问题,例如: 如何有效地建模伯努利随机变量的总和? 但是设置却大不相同: S=∑i=1,NXiS=∑i=1,NXiS=\sum_{i=1,N}{X_i},,〜20,〜0.1P(Xi=1)=piP(Xi=1)=piP(X_{i}=1)=p_iNNNpipip_i 我们有伯努利随机变量结果的数据:,Xi,jXi,jX_{i,j}Sj=∑i=1,NXi,jSj=∑i=1,NXi,jS_j=\sum_{i=1,N}{X_{i,j}} 如果我们用最大似然估计来估计(并得到),那么则要大得多,由其他条件期望:pipip_ip^MLEip^iMLE\hat p^{MLE}_iP^{S=3}(p^MLEi)P^{S=3}(p^iMLE)\hat P\{S=3\} (\hat p^{MLE}_i)P^{S=3}(p^MLEi)−P^expected{S=3}≈0.05P^{S=3}(p^iMLE)−P^expected{S=3}≈0.05\hat P\{S=3\} (\hat p^{MLE}_i) - \hat P^{expected} \{S=3\}\approx 0.05 因此,和不能被视为独立的(它们具有较小的依赖性)。XiXiX_{i}XjXjX_{j} (j&gt;k)(j&gt;k)(j>k) 有一些这样的约束:和(已知),这应该有助于估计。pi+1≥pipi+1≥pip_{i+1} \ge p_i∑s≤2P^{S=s}=A∑s≤2P^{S=s}=A\sum_{s \le 2}\hat P\{S=s\}=AP{S}P{S}P\{S\} 在这种情况下,我们如何尝试对伯努利随机变量的总和建模? 哪些文献可能对解决任务有用? 更新 还有一些进一步的想法: (1)可以假设之间的未知依赖关系是在连续1次或更多次成功之后开始的。因此,当,和。XiXi{X_i}∑i=1,KXi&gt;0∑i=1,KXi&gt;0\sum_{i=1,K}{X_i} > 0pK+1→p′K+1pK+1→pK+1′p_{K+1} \to p'_{K+1}p′K+1&lt;pK+1pK+1′&lt;pK+1p'_{K+1} < p_{K+1} (2)为了使用MLE,我们需要最少可疑的模型。这是一个变体: P{X1,...,Xk}=(1−p1)...(1−pk)P{X1,...,Xk}=(1−p1)...(1−pk)P\{X_1,...,X_k\}= (1-p_1) ... (1-p_k)如果对于任何k个,则 如果且,并且对于任意k。∑i=1,kXi=0∑i=1,kXi=0\sum_{i=1,k}{X_i} = 0P{X1,...,Xk,Xk+1,...,XN}=(1−p1)...pkP′{Xk+1,...,XN}P{X1,...,Xk,Xk+1,...,XN}=(1−p1)...pkP′{Xk+1,...,XN}P\{X_1,...,X_k,X_{k+1},...,X_N\}= (1-p_1) ... p_k P'\{X_{k+1},...,X_N\}∑i=1,k−1Xi=0∑i=1,k−1Xi=0\sum_{i=1,k-1}{X_i} = …

2
计算数据的ROC曲线
因此,我进行了16次试验,试图使用汉明距离从生物特征中鉴定一个人。我的阈值设置为3.5。我的数据如下,只有试验1为“真阳性”: Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 5 0.55 6 0.47 7 0.47 8 0.32 9 0.39 10 0.45 11 0.42 12 0.37 13 0.66 14 0.39 15 0.44 16 0.39 我的困惑是,我真的不确定如何根据此数据制作ROC曲线(FPR与TPR或FAR与FRR)。哪一个都不重要,但是我只是对如何进行计算感到困惑。任何帮助,将不胜感激。
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 

3
正态分布
不幸的是,有一个统计问题,我不知道从哪里开始(我正在独自学习,所以如果我听不懂的话,没有人可以问。 问题是 iid N (a ,b 2); a = 0 ; b 2 = 6 ; v a r (X 2 + Y 2)= ?X,YX,YX,Yñ(a ,b2); a = 0 ; b2= 6 ; v 一个[R (X2+ Y2)= ?N(a,b2);a=0;b2=6;var(X2+Y2)=?N(a,b^2); a=0; b^2=6; var(X^2+Y^2)=?
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.