Questions tagged «iid»

iid是独立且分布均匀的首字母缩写。许多统计方法都假定数据是iid。也就是说,每个观察值都来自同一分布,并且独立于其他观察值。

5
关于iid假设在统计学习中的重要性
在统计学习中,隐式或显式地,总是假设训练集由输入/响应元组是从同一个联合分布中独立得出的,D ={ X, y }D={X,y}\mathcal{D} = \{ \bf {X}, \bf{y} \}ñNN(X一世,ÿ一世)(Xi,yi)({\bf{X}}_i,y_i) P( X,ÿ)P(X,y)\mathbb{P}({\bf{X}},y) p (X,ÿ)= p (y| X)p (X)p(X,y)=p(y|X)p(X) p({\bf{X}},y) = p( y \vert {\bf{X}}) p({\bf{X}}) 和通过特定的学习算法试图捕获的关系。从数学上讲,该iid假设写道:p (ÿ| X)p(y|X)p( y \vert {\bf{X}}) (X一世,ÿ一世)〜P(X,ÿ),∀ 我= 1 ,。。。,N(X一世,ÿ一世) 独立于 (XĴ,ÿĴ),∀ 我≠ Ĵ ∈ { 1 ,。。。,N}(Xi,yi)∼P(X,y),∀i=1,...,N(Xi,yi) independent of (Xj,yj),∀i≠j∈{1,...,N}\begin{gather} ({\bf{X}}_i,y_i) \sim \mathbb{P}({\bf{X}},y), …

3
挑逗:从统一的[0,1]分布得出的iid序列的预期长度是单调增加的吗?
这是定量分析师职位的面试问题,在此报告。假设我们从均匀的分布绘制并且绘制为iid,则单调递增分布的预期长度是多少?即,如果当前绘制小于或等于上一个绘制,我们将停止绘制。[0,1][0,1][0,1] 我得到了前几个: \ Pr (\ text {length} = 2)= \ int_0 ^ 1 \ int_ {x_1} ^ 1 \ int_0 ^ {x_2} \ mathrm {d} x_3 \,\ mathrm {d} x_2 \,\ mathrm {d} x_1 = 1/3 \ Pr(\ text {length} = 3)= \ int_0 ^ 1 \ int_ {x_1} ^ …

1
PCA的属性用于从属观察
我们通常将PCA用作假设情况为iid的数据的降维技术 问题:在将PCA应用于相关的非id数据时,典型的细微差别是什么?持有iid数据的PCA的哪些好用/有用属性被破坏(或完全丢失)? 例如,数据可以是多元时间序列,在这种情况下,可以预期自相关或自回归条件异方差(ARCH)。 上应用PCA,以时间序列数据的几个相关的问题已经被问过,如1,2,3,4,但是我正在寻找一个更普遍和全面的答案(而无需在每个单独的点太多展开)。 编辑:正如@ttnphns所指出的,PCA 本身不是推论分析。但是,人们可能会对PCA的泛化性能感兴趣,即关注样本PCA的总体对应物。如Nadler(2008)所写: 假设给定数据是来自(通常是未知的)分布的有限随机样本,那么一个有趣的理论和实践问题是,从有限数据计算出的样本PCA结果与基础总体模型的结果之间的关系。 参考文献: 纳兹勒,波阿斯。“用于主成分分析的有限样本近似结果:矩阵摄动法。” 统计年鉴(2008):2791-2817。

2
是否存在逻辑回归的iid假设?
是否存在逻辑回归的响应变量的iid假设? 例如,假设我们有数据点。响应似乎来自具有的伯努利分布。因此,我们应该有具有不同参数伯努利分布。100010001000YiYiY_ipi=logit(β0+β1xi)pi=logit(β0+β1xi)p_i=\text{logit}(\beta_0+\beta_1 x_i)100010001000ppp 因此,它们是“独立的”,但不是“相同的”。 我对吗? PS。我从“机器学习”文献中学到了逻辑回归,在该文献中我们优化了目标函数并检查了它是否适合测试数据,而没有过多地讨论假设。 我的问题从这篇文章开始理解广义线性模型中的链接函数,在这里我尝试了解有关统计假设的更多信息。

4
“随机样本”和“ iid随机变量”是同义词吗?
我一直很难理解“随机样本”和“ iid随机变量”的含义。我试图从几个方面找出含义,但是却越来越困惑。我将在此发布的内容尝试并了解: Degroot的概率与统计说: 随机样本/ iid /样本大小:考虑真实行上的给定概率分布,该概率分布可以用pf或pdf。据说有随机变量如果这些随机变量是独立的,并且每个变量的边际pf或pdf为从该分布形成一个随机样本。这种随机变量也被认为是独立且均等分布的,简称iid。我们将随机变量的数量n称为样本量。FFfññnX1个,。。。, XñX1个,。。。,XñX_1 , . . . , X_nFFf 但是我写过的另一本统计书说: 在随机抽样中,我们保证总体中的每个个体单元都有相等的被选择的机会(概率)。 因此,我觉得iid是构成随机样本的元素,而拥有随机样本的过程就是随机抽样。我对吗? PS:我对这个话题非常困惑,因此,我感谢您详尽的答复。谢谢。

2
测试IID采样
您将如何测试或检查采样是否为IID(独立且完全相同)?请注意,我不是指高斯和完全分布式,而只是IID。 我想到的想法是,将样本重复分成相等大小的两个子样本,执行Kolmogorov-Smirnov检验,并检查p值的分布是否均匀。 欢迎对该方法发表任何评论,并提出任何建议。 开始赏金后的澄清: 我正在寻找可用于非时间序列数据的常规测试。



1
IID随机变量的期望值
我碰到这种推导,我不明白:如果X1,X2,...,XnX1,X2,...,XnX_1, X_2, ..., X_n是大小的随机样本n的平均值的人口采取μμ\mu和方差σ2σ2\sigma^2,那么 X¯=(X1+X2+...+Xn)/nX¯=(X1+X2+...+Xn)/n\bar{X} = (X_1 + X_2 + ... + X_n)/n E(X¯)=E(X1+X2+...+Xn)/n=(1/n)(E(X1)+E(X2)+...+E(Xn))E(X¯)=E(X1+X2+...+Xn)/n=(1/n)(E(X1)+E(X2)+...+E(Xn))E(\bar{X}) = E(X_1 + X_2 + ... + X_n)/n = (1/n)(E(X_1) + E(X_2) + ... + E(X_n)) E(X¯)=(1/n)(μ+μ+...n times)=μE(X¯)=(1/n)(μ+μ+...n times)=μE(\bar{X}) = (1/n)(\mu + \mu + ...n ~\text{times}) = \mu 这是我迷路的地方。使用的自变量为E(Xi)=μE(Xi)=μE(X_i) = \mu因为它们的分布相同。实际上这不是事实。假设我有一个样品,S={1,2,3,4,5,6}S={1,2,3,4,5,6}S=\{1,2,3,4,5,6\},然后,如果随机地选择2号与替换,并重复此过程10次,然后我得到10个样品:(5,4)(2 ,5)(1,2)(4,1)(4,6)(2,4)(6,1)(2,4)(3,1)(5,1)。这是2个随机变量样子X1,X2X1,X2X_1, X_2。现在,如果我将期望值X1X1X_1我明白了 E(X1)=1.(1/10)+2.(3/10)+3.(1/10)+4.(2/10)+5.(2/10)+6.(1/10)=34/10=3.4E(X1)=1.(1/10)+2.(3/10)+3.(1/10)+4.(2/10)+5.(2/10)+6.(1/10)=34/10=3.4E(X_1) = 1.(1/10) …

4
假设是iid随机变量。预计序列何时会首次减少?
如标题中所建议。假设是pdf连续iid随机变量。考虑,,因此是序列首次减少时的时间。那么的值是多少?X1个,X2,… ,XñX1个,X2,…,XñX_1, X_2, \dotsc, X_nFFfX1个≤ X2... ≤ Xñ− 1> XñX1个≤X2…≤Xñ-1个>XñX_1 \leq X_2 \dotsc \leq X_{N-1} > X_Nñ≥ 2ñ≥2N \geq 2ññNË[ N]Ë[ñ]E[N] 我尝试首先评估。我有 同样,我得到。当变大时,计算变得更加复杂,我找不到模式。谁能建议我应该如何进行?P[ N= 我]P[ñ=一世]P[N = i] P[N=4]=1P[ N= 2 ]P[ N= 3 ]= ∫∞- ∞F(x )F(x )dX= F(x )22|∞- ∞= 12= ∫∞- ∞F(x )∫∞XF(y)F(y)dÿdX= ∫∞- ∞F(x )1 − F(x …

2
两个rv差异的统一PDF
是否有可能使两个iid rv的差异的PDF看起来像一个矩形(而不是说,如果rv取自均匀分布,则得到的三角形)。 也就是说,对于所有-1 <x <1,jk的PDF f(对于从某个分布中提取的两个iid rv)是否有f(x)= 0.5? 除j和k的分布没有限制外,最小值为-1且最大值为1。 经过一些试验,我认为这可能是不可能的。
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.