Questions tagged «expected-value»

随机变量的期望值是随机变量可以采用的所有可能值的加权平均值,其权重等于采用该值的概率。




2
构造示例显示
如何构造一个E(1X)=1E(X)E(1X)=1E(X)\mathbb{E}\left(\frac{1}{X}\right)=\frac{1}{\mathbb{E}(X)}假设P(X≠0)=1P(X≠0)=1\mathbb{P}(X\ne0)=1? E(X )成立。 从Jensen不等式得出的正值RV XXX的不等式类似于E(1X)≥1E(X)E(1X)≥1E(X)\mathbb{E}\left(\frac{1}{X}\right)\ge\frac{1}{\mathbb{E}(X)}(如果X&lt;0X&lt;0X<0则为反向不等式)。这是因为该映射x↦1xx↦1xx\mapsto\frac{1}{x}对于x&gt;0x&gt;0x>0是凸的,对于x&lt;0x&lt;0x<0凹的。遵循詹森不等式中的等式条件,我猜想分布必须退化才能保持所需的等式。如果X=1X=1X=1ae,则等式成立的一个简单情况当然是在问题书中找到的一个示例:考虑一个离散随机变量XXX,使得P(X=−1)=19,P(X=12)=P(X=2)=49P(X=−1)=19,P(X=12)=P(X=2)=49\mathbb{P}(X=-1)=\frac{1}{9}, \mathbb{P}(X=\frac{1}{2})=\mathbb{P}(X=2)=\frac{4}{9}。然后可以很容易地验证E(1X)=1E(X)=1E(1X)=1E(X)=1\mathbb{E}\left(\frac{1}{X}\right)=\frac{1}{\mathbb{E}(X)}=1。 此示例表明,XXX不必为正(或负)ae即可保持标题中的相等。这里的分布也不退化。 我如何构造一个示例,可能就像我在书中找到的那样?有动力吗?

2
Iid Gumbel变量最大值的期望
我一直在经济学期刊上阅读随机效用模型中使用的特定结果。结果的一种版本是:如果 Gumbel(,则:ϵi∼iid,ϵi∼iid,\epsilon_i \sim_{iid}, μ,1),∀iμ,1),∀i\mu, 1), \forall i E[maxi(δi+ϵi)]=μ+γ+ln(∑iexp{δi}),E[maxi(δi+ϵi)]=μ+γ+ln⁡(∑iexp⁡{δi}),E[\max_i(\delta_i + \epsilon_i)] = \mu + \gamma + \ln\left(\sum_i \exp\left\{\delta_i \right\} \right), 其中γ≈0.52277γ≈0.52277\gamma \approx 0.52277是Euler-Mascheroni常数。我检查了使用R是否有意义,并且确实如此。Gumbel (μ,1)(μ,1)(\mu, 1)分布的CDF为: G(ϵi)=exp(−exp(−(ϵi−μ)))G(ϵi)=exp⁡(−exp⁡(−(ϵi−μ)))G(\epsilon_i) = \exp(-\exp(-(\epsilon_i - \mu))) 我正在尝试证明这一点,但没有成功。我已经尝试过证明自己,但是我无法走过某个特定的步骤。 谁能指出我对此的证明?如果没有,也许我可以将尝试的证据发布到卡住的地方。

1
在原假设下,确定系数期望值
我对本文第一页底部 关于调整的声明感到好奇R2adjustedRadjusted2R^2_\mathrm{adjusted} R2adjusted=1−(1−R2)(n−1n−m−1).Radjusted2=1−(1−R2)(n−1n−m−1).R^2_\mathrm{adjusted} =1-(1-R^2)\left({\frac{n-1}{n-m-1}}\right). 文本指出: 调整的逻辑如下:在普通多元回归中,随机预测变量平均解释响应变化的比例1/(n–1)1/(n–1)1/(n – 1),因此mmm随机预测变量平均一起解释m/(n–1)m/(n–1)m/(n – 1)响应的变化;换句话说,R ^ 2的期望值R2R2R^2为E(R2)=m/(n–1)E(R2)=m/(n–1)\mathbb{E}(R^2) = m/(n – 1)。将[ R2adjustedRadjusted2R^2_\mathrm{adjusted} ]公式应用于该值(所有预测变量都是随机的),得出R2adjusted=0Radjusted2=0R^2_\mathrm{adjusted} = 0。” 对于R ^ 2_ \ mathrm {adjusted},这似乎是一个非常简单且可解释的动机R2adjustedRadjusted2R^2_\mathrm{adjusted}。但是,对于单个随机(即不相关)的预测变量,我无法得出E(R2)=1/(n–1)E(R2)=1/(n–1)\mathbb{E}(R^2)=1/(n – 1))的值。 有人可以在这里指出正确的方向吗?

5
如何在大量数据点中进行值的插补?
我的数据集非常大,大约缺少5%的随机值。这些变量相互关联。以下示例R数据集只是一个具有虚拟相关数据的玩具示例。 set.seed(123) # matrix of X variable xmat &lt;- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) &lt;- paste ("M", 1:10000, sep ="") rownames(xmat) &lt;- paste("sample", 1:200, sep = "") #M variables are correlated N &lt;- 2000000*0.05 # 5% random missing values inds &lt;- round ( runif(N, 1, length(xmat)) …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

2
虚假相关的期望值
我们独立于正态分布绘制NNN样本,每个样本的大小为。(μ ,σ 2)nnn(μ,σ2)(μ,σ2)(\mu,\sigma^2) 然后,从样本中选择彼此具有最高(绝对)Pearson相关性的2个样本。NNN 这种相关性的期望值是多少? 谢谢[PS这不是作业]

3
您如何计算
如果是指数分布(我= 1 ,。。。,Ñ )具有参数λ和X 我的是相互独立的,什么是期望X一世XiX_i(我= 1 ,。。。,Ñ )(i=1,...,n)(i=1,...,n)λλ\lambdaX一世XiX_i (∑我= 1ñX一世)2(∑i=1nXi)2 \left(\sum_{i=1}^n {X_i} \right)^2 根据和λ以及其他常数?ñnnλλ\lambda 注意:这个问题已经在/math//q/12068/4051上获得了数学答案。读者也可以看看。


1
除柯西以外,是否还有其他样本的算术平均值遵循相同分布的分布?
如果遵循柯西分布然后Ŷ = ˉ X = 1XXX也遵循与X完全相同的分布;看到这个线程。ÿ= X¯= 1ñ∑ñ我= 1X一世ÿ=X¯=1个ñ∑一世=1个ñX一世Y = \bar{X} = \frac{1}{n} \sum_{i=1}^n X_iXXX 这个属性有名字吗? 还有其他分布是真的吗? 编辑 提出此问题的另一种方式: 令为概率密度为f (x )的随机变量。XXXF(x )F(X)f(x) 令,其中X我表示的第i个观察X。ÿ= 1ñ∑ñ我= 1X一世ÿ=1个ñ∑一世=1个ñX一世Y=\frac 1 n\sum_{i=1} ^n X_iX一世X一世X_iXXX 本身可以视为随机变量,而无需以 X的任何特定值为条件。ÿÿYXXX 如果遵循柯西分布,则Y的概率密度函数为f (x )XXXÿÿYF(x )F(X)f(x) 是否存在其他类型的(非平凡*)概率密度函数,从而导致Y具有f (x )概率密度函数?F(x )F(X)f(x)ÿÿYF(x )F(X)f(x) *我能想到的唯一简单的例子是狄拉克三角洲。即不是随机变量。

2
平方伽玛的期望
如果使用和参数化了Gamma分布,则:αα\alphaββ\beta E(Γ(α,β))=αβE(Γ(α,β))=αβ E(\Gamma(\alpha, \beta)) = \frac{\alpha}{\beta} 我想计算平方Gamma的期望值,即: E(Γ(α,β)2)=?E(Γ(α,β)2)=? E(\Gamma(\alpha, \beta)^2) = ? 我认为是: E(Γ(α,β)2)=(αβ)2+αβ2E(Γ(α,β)2)=(αβ)2+αβ2 E(\Gamma(\alpha, \beta)^2) = \left(\frac{\alpha}{\beta}\right)^2 + \frac{\alpha}{\beta^2} 有人知道后一种表达是否正确吗?

1
预期平均值将超过一个值的预期次数
给定一系列iid随机变量,例如,对于,为,我试图限制经验均值的预期次数会超过一个值,因为我们继续绘制样本,即: Xi∈[0,1]Xi∈[0,1]X_i \in [0,1]i=1,2,...,ni=1,2,...,ni = 1,2,...,n1n∑ni=1Xi1n∑i=1nXi\frac{1}{n}\sum_{i=1}^n X_ic≥0c≥0c \geq 0T=def∑j=1nP({1j∑i=1jXi≥c})T=def∑j=1nP({1j∑i=1jXi≥c}) \mathcal{T} \overset{def}{=} \sum_{j=1}^n \mathbb{P} \left(\left\{ \frac{1}{j}\sum_{i=1}^j X_i \geq c\right\}\right) 如果我们假设对于,我们可以使用Hoeffding不等式得出c=a+E[X]c=a+E[X]c = a + \mathbb{E}[X]a&gt;0a&gt;0a > 0 T≤∑j=1ne−2ja2=1−e−2a2ne2a2−1T≤∑j=1ne−2ja2=1−e−2a2ne2a2−1\begin{align} \mathcal{T} & \leq \sum_{j=1}^n e^{-2ja^2} \\ & = \frac{1 - e^{-2 a^2 n}}{e^{2 a^2}-1} \end{align} 哪个看起来不错(也许),但实际上是一个松散的界限,是否有更好的方法来限制此值?我希望可能会有一种方法,因为不同的事件(每个)显然不是独立的,我不知道有任何方法可以利用这种依赖性。同样,最好删除大于平均值的限制。jjjccc 编辑:如果我们使用马尔可夫不等式,可以消除对大于均值的限制:ccc T≤∑j=1n1jE[X]c=E[X]HncT≤∑j=1n1jE[X]c=E[X]Hnc\begin{align} \mathcal{T} & \leq \sum_{j=1}^n \frac{\frac{1}{j}\mathbb{E}[X]}{c} \\ …

1
零膨胀泊松分布的均值和方差
谁能用概率质量函数显示零膨胀泊松的期望值和方差 f(y)={π+(1−π)e−λ,(1−π)λye−λy!,if y=0if y=1,2....f(y)={π+(1−π)e−λ,if y=0(1−π)λye−λy!,if y=1,2.... f(y) = \begin{cases} \pi+(1-\pi)e^{-\lambda}, & \text{if }y=0 \\ (1-\pi)\frac{\lambda^{y}e^{-\lambda}}{y!}, & \text{if }y=1,2.... \end{cases} 其中是通过二项式过程观察到的零值的概率,而是泊松的均值的推导?ππ\piλλ\lambda 结果为期望值,方差为。μ=(1−π)λμ=(1−π)λ\mu =(1-\pi)\lambdaμ+π1−πμ2μ+π1−πμ2\mu+ \frac{\pi}{1-\pi}\mu^{2} 添加:我正在寻找一个过程。例如,您可以使用力矩生成功能吗?最终,我想看看如何做到这一点,以更好地理解零膨胀伽玛和其他。

2
正弦和余弦之间的相关性
假设XXX均匀地分布在[ 0 ,2个π][0,2π][0, 2\pi]。让ÿ= 罪XY=sin⁡XY = \sin X和ž= cosXZ=cos⁡XZ = \cos X。证明ÿYY和之间的相关性žZZ为零。 看来我需要知道正弦和余弦的标准偏差及其协方差。我该如何计算? 我认为我需要假设XXX具有均匀的分布,然后看一下转换后的变量ÿ= 罪(X)Y=sin⁡(X)Y=\sin(X)和ž= cos(X)Z=cos⁡(X)Z=\cos(X)。然后潜意识统计学家的定律将给出期望值 Ë[ Y] = 1b − a∫∞- ∞罪(x )dXE[Y]=1b−a∫−∞∞sin⁡(x)dxE[Y] = \frac{1}{b-a}\int_{-\infty}^{\infty} \sin(x)dx和Ë[ Z] = 1b − a∫∞- ∞cos(x )dXE[Z]=1b−a∫−∞∞cos⁡(x)dxE[Z] = \frac{1}{b-a}\int_{-\infty}^{\infty} \cos(x)dx (密度是恒定的,因为它是均匀的分布,因此可以从积分中移出)。 但是,这些积分没有定义(但我认为柯西主值是零)。 我该如何解决这个问题?我想我知道解决方案(相关性为零,因为正弦和余弦具有相反的相位),但是我找不到如何导出它。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.