什么是iid随机变量？

49

您将如何向非技术人员解释iid（独立且分布均匀）？

random-variable intuition

— 用户333
source

55

它的意思是“独立且分布相同”。

一个很好的例子是一连串的公平硬币抛出：硬币没有记忆，因此所有抛出都是“独立的”。

而且每一掷都是50:50（正面：尾巴），因此硬币是公平的-可以说，每一掷的分配都是相同的：“完全相同”。

一个好的起点是Wikipedia页面。

：：编辑：：

单击此链接可以进一步探索该概念。

— 冯吉德
source

11

我不知道掷硬币的例子是否会给人以错觉，那就是每个事件都必须是平等的……

— Michael McGowan

1

因此，是否有必要使IID随机变量具有等概率？如果它们不是等概率的，那么如何解释“相同分布”呢？提前非常感谢...

6

@Nalini的“ equi-probable”不是“相同分布”的同义词。如果和是iid，则意味着它们取自同一分布，而不是该分布中的所有值均具有同等的可能性（请考虑正态分布）。和的期望值相同。

x

$x$

y

$y$

x

$x$

y

$y$

— 杰森·摩根

如果两个变量是独立且正态分布的，但均值和方差不同，那么它们仍然是同义的吗？

— spurra

1

@spurra我不这么认为..他们只是独立的

— user3595632

22

非技术性解释：

独立是一个非常笼统的概念。如果一个事件的发生没有为您提供有关另一个事件是否发生的任何信息，则两个事件被认为是独立的。特别地，我们归因于第二事件的概率不受第一事件已发生的认识的影响。

独立事件的示例，可能分布相同
假设一个接一个地扔两个不同的硬币。假设您的拇指在翻转第一枚硬币时不会感到过分疲劳，可以合理地假设知道第一枚硬币的掷出导致正面爆炸，并不会影响您认为第二掷的正面概率。两种事件被称为独立事件。
${first coin toss resulted in Heads} and {second coin toss resulted in Heads}$
- 如果我们知道或坚定地坚持认为这两个硬币有不同的概率导致出现正面，那么事件的分布就不会相同。
- 如果我们知道或假设这两个硬币有相同的概率出现，那么上述事件的分布也相同， 这意味着它们都具有相同的出现概率。但是请注意，除非，否则Heads的概率不等于Tails的概率。如评论之一所述，“相同分布”与“相等概率”不同。 $p$ $p$ $p = \frac 12$
相同分布的非独立事件的示例
考虑一个装有两个球的，一个黑一个白。我们进入其中，一个接一个地画出两个球，随机选择第一个（当然，这决定了下一个球的颜色）。因此，实验的两个相同可能的结果是（白色，黑色）和（黑色，白色），我们看到第一个球同样可能是黑色或白色，第二个球也同样可能是黑色或白色。换句话说，事件当然是分布相同的，但它们绝对是不
${first ball drawn is Black} and {second ball drawn is Black}$ $\{\text{first ball drawn is Black}\}~~\text{and}~~\{\text{second ball drawn is Black}\}$ 独立事件。确实，如果我们知道第一个事件已经发生，那么我们肯定会知道第二个事件不会发生。因此，虽然我们的第二个事件的概率的初步评估是，一旦我们知道发生了第一次活动，我们有最好的修改我们得出第二概率的评估将是黑色的到。 $\frac 12$ $\frac 12$ $0$

— 迪利普·萨瓦特（Dilip Sarwate）
source

“如评论中的一项所述，“相同分布”与“相等概率”不同。”有什么区别？“等概率”是指头和尾都一样？鉴于“同等分布”是指每个事件发生正面冲突的可能性相同？

— 红豌豆

3

@TheRedPea不完全是。如果我们有一个偏见的硬币以概率出现H

p \neq \frac{1}{2}

$p \ne \frac 12$

p

$p$

p

$p$

1 - p

$1-p$

2

n

$n$

\frac{1}{n}

$\frac 1n$

好的，所以相同的分布是指整个概率分布，而相等的概率是指该概率分布的一部分。我现在明白了，谢谢。

— 红豌豆

我不确定最后一个示例是否完全相同。是否存在争议：“ 如果两个事件不是独立的，那么它们就不能来自相同的分布”？例如，在您的示例中，我会说由于第一个事件，第二次抽奖具有不同的分布。

— jiggunjer

3

随机变量是包含场景中所有可能事件的概率的变量。例如，让我们创建一个随机变量，该变量代表100次抛硬币中的正面数目。随机变量将包含获得1个头，2个头，3个头.....一直到100个头的概率。让我们把这个随机变量X。

如果您有两个随机变量，则在以下情况下它们是IID（独立地均匀分布）：

如果他们是独立的。如上所述，独立性意味着一个事件的发生不提供有关另一事件的任何信息。例如，如果在100次翻转后获得100个头，则在下一次翻转中获得头或尾的概率是相同的。
如果每个随机变量共享相同的分布。例如，让我们从-X上方获取随机变量。假设X代表奥巴马即将掷硬币100次。现在，假设Y代表一名要掷硬币100次的牧师。如果奥巴马和牧师以相同的概率掷硬币落在头上，则X和Y被认为分布相同。如果我们从牧师或奥巴马那里反复采样，那么采样被认为是分布均匀的。

旁注：独立性也意味着您可以乘以概率。假设正面的概率为p，那么连续获得两个正面的概率为p * p或p ^ 2。

— Thebajo
source

2

此示例可以显示两个因变量可以具有相同的分布：

假设有两个连续的实验，每100次投掷偏见硬币，其中Head的总数被建模为第一个实验的随机变量X1和第二个实验的X2。X1和X2是具有参数100和p的二项式随机变量，其中p是硬币的偏差。
因此，它们是相同分布的。但是，它们不是独立的，因为前者的价值足以说明后者的价值。就是说，如果第一个实验的结果是100 Heads，这将告诉我们很多有关硬币的偏差的信息，因此会为我们提供有关X2分布的许多新信息。
由于X2和X1来自同一枚硬币，因此它们的分布相同。

同样正确的是，如果有2个随机变量是相关的，那么给定X1的X2的后验将永远不会与X2的先验相同，反之亦然。当X1和X2独立时，它们的后代等于它们的先验。因此，当两个变量是相关的时，对其中一个的观察会导致对第二个变量的分布进行估计。两者仍然可能来自同一分布，这只是我们在此过程中了解的更多信息。因此，回到抛硬币实验，最初在没有任何信息的情况下，我们可以假设X1和X2遵循参数为100和0.5的二项分布。但是，在连续观察100个Heads之后，我们当然会修改对p参数的估计，使其非常接近1。

— 射频7
source

1

来自同一分布的几个随机抽奖的集合。一个示例是将大理石从袋子中拉出10,000次并计算将红色大理石拉出的次数。

— 卡列布
source

1

您可以扩展一下如何将其添加到现有答案中吗？

— mdewey

0

$X$ $\mu=3$ $\sigma^2=4$ $X \sim N(3 , 4)$

$Y$ $Y \sim N(3, 4)$ $X$ $Y$

但是，分配相同并不一定意味着独立。

— 贾拉勒
source

8

当您依靠诸如“随机变量”，“正态分布”，“ pdf”，“方差”和“独立性”之类的技术术语时，必须牢记一组有趣的“非技术人员”。我敢说这是空的。

— whuber

“ 相同地分配不一定意味着独立 ”。依存关系如何对两个相同分布的变量产生影响？在我看来，依赖性导致不相同，但并非所有的不一致性都是由于依赖性引起的。

— jiggunjer