Answers:
随机变量是其值取决于未知事件的变量。我们可以将未知事件概括为“状态”,然后随机变量是状态的函数。
例:
假设我们有三个掷骰子(,D 2,D 3)。然后状态S = (D 1,D 2,D 3)。
在考虑最近的评论时,我注意到到目前为止,所有答复都受到使用不确定变量(如“变量”)和模糊术语(如“未知”)或对技术数学概念(如“函数”和“概率空间”)的吸引力的困扰。我们要对非数学的人说些什么,他们想要一个简单,直观但准确的“随机变量”定义?在对随机现象的简单模型进行了一些初步介绍之后,我提供了一个足够短的定义以适合一行。由于可能无法完全满足要求,因此后面将说明如何将其扩展到常规技术定义。
解决随机变量背后的想法的一种方法是诉诸于随机的票证模型。该模型用装满票的盒子代替了实验或观察。每张票上都写有实验的可能结果。(结果可以很简单,但实际上,它是更复杂的事情,例如股票价格的历史记录,长时间实验的完整记录或文档中所有单词的顺序。)所有可能的结果在票证中至少出现一次;一些结果可能会出现在许多票证上。
我们没有实际进行实验,而是彻底但盲目地想象-将所有票混合并仅选择一张。如果我们能够证明真实的实验应该像这样进行,那么我们已经将潜在的复杂(且昂贵且冗长)的真实实验简化为简单,直观,思考的实验(或“统计模型” ”)。此模型提供的清晰性和简单性使分析实验成为可能。
标准示例涉及扔硬币和骰子以及抽出纸牌的结果。这些问题的琐碎性在一定程度上分散了人们的注意力,因此为了说明一下,假设我们对2016年美国总统大选的结果感到担忧。为简化起见,我假设两个主要政党之一-共和党(R)或民主党(D)-将获胜。因为(使用当前可用的信息)结果不确定,我们可以想象将票放入一个盒子中:其中一些上面写有“ R”,而其他上写有“ D”。我们的结果模型是从此框中准确抽取一张票。
缺少一些东西:我们尚未规定每个结果有多少张票。实际上,找到答案是统计学的主要问题:基于观察(和理论),框中每个结果的相对比例可以说些什么?
(我希望这是明确的比例中的每种箱子票的确定它的性质,而不是每张门票的实际人数的比例被定义-像往常一样-是各种票除以的数例如,一个包含一张“ D”票和一张“ R”票的盒子的行为就与具有一百万张“ D”票和一百万张“ R”票的盒子的行为完全相同,因为在两种情况下,每种门票总数的50%,因此,在门票完全混合后,每张都有50%的机会被抽奖。)
但是,我们不要在此提出这个问题,因为我们已接近定义随机变量的目标。到目前为止,该模型的问题在于它无法量化,而我们希望能够用它来回答量化问题。我也不是说琐碎的问题,而是真实而实际的问题,例如“如果我的公司在美国近海化石燃料开发上投资了10亿欧元,那么该投资的价值将因2016年大选而改变多少? ?在这种情况下,该模型是如此简单,以至于我们无法对这个问题做出切合实际的答案,但是我们甚至可以咨询经济人员,并征询他们对两种可能结果的看法:
如果民主党获胜,投资会改变多少?(假设答案是美元。)
如果共和党获胜,它将改变多少?(假设答案是美元。)
答案是数字。要在模型中使用它们,我将要求我的工作人员浏览框中的所有票证,并在每张“ D”票证上写下“ 元”,在每张“ R”票证上写下“ r元”。现在,我们可以清晰,定量地对投资的不确定性进行建模:其选举后的价值变化与接收从该框中随机抽取的一张彩票上所写的金额相同。
此模型可帮助我们回答有关投资的其他问题。例如,我们应该如何不确定该投资的价值?尽管存在针对此不确定性的(简单)数学公式,但只要重复使用我们的模型(可能超过一千次),以查看实际发生了哪些结果并衡量其分布,我们就可以合理准确地重现它们的答案。 票证即用模型为我们提供了一种对不确定结果进行定量推理的方法。
为了获得有关不确定或可变现象的定量答案,我们可以采用盒中票的模型,并在票上写上数字。 这个写数字的过程只需要遵循一个规则:它必须是一致的。在此示例中,每张民主党票都必须写上“ 美元”(无例外),而每张共和党票都必须写上“ r美元”。
一个随机变量是在一个盒子票写号的任何一致的方式。
(为此,数学符号是为重编号过程起个名字,通常以大写拉丁字母(例如或Y)开头。写在票证上的识别信息通常以小写字母命名,通常为ω(小写希腊字母“ omega” ),通过随机变量X与票据ω相关联的值表示为X (ω ),然后在示例中,我们可以说类似“ X是代表投资价值变化的随机变量”之类的东西。将通过声明X (D )=完全指定和 X (R )= r。在更复杂的情况下, X的值由更复杂的描述给出,通常由公式给出。例如,票证可能表示某股票一年的收盘价,而随机变量 X可能是该股票某些衍生产品在特定时间的价值,例如看跌期权。期权合约描述了如何计算 X。期权交易者正是使用这种模型来为其产品定价。)
您是否注意到这样的既不是随机变量也不是变量?它既不是“不确定的”也不是“未知的”。这是一个明确的分配(从数字到结果),我们可以在充分了解和完全确定的情况下写下这些东西。什么是随机的绘画从盒子票的过程; 什么是变量是对可能会被吸入的票值。
还要注意,在评估投资时涉及两个不同问题的明确区分:我请经济学家为我确定,但不要对选举结果持怀疑态度。我将使用其他信息(也许通过拜访政治顾问,占星家,使用Ouija板或其他工具)来估计要放入框中的“ D”票和“ R”票的比例。
当随机变量的定义伴随着“可衡量的” 警告时,定义者所想到的就是“盒中票”模型对具有无限多种可能结果的情况的概括。(从技术上说,它是只需要不可数其中无限成果或不合理的概率都参与其中,甚至在后一种情况下是可以避免的。)有了无穷多的结果就很难说了什么比例占总数的那样。如果有无限多的“ D”票和无限多的“ R”票,它们的相对比例是多少?我们无法仅将一个无穷大除以另一个无穷大!
在这种情况下,我们需要一种不同的方式来指定比例。“可测量的”票证集合是框中可以定义票证比例的任何票证集合。完成此操作后,我们一直认为是“比例”的数字称为“概率”。(并非每张票证都有与之相关的概率。)
除了满足一致性要求之外,随机变量还必须允许我们计算与有关结果的自然问题相关的概率。具体来说,我们要保证以下形式的问题:“值X (ω )位于某某(a)和某某(b)之间的机会是多少?” 不管我们为极限a和b给出两个值是多少,实际上都会有数学上明确定义的答案。据说这种重写程序是“可测量的”。根据定义,所有随机变量都必须是可测量的。
与常规变量不同,随机变量不能代替单个不变的值。相反,可以陈述统计属性,例如随机变量的分布。分布是一个函数,它提供变量采用给定值或在给定特定参数(例如平均值或标准偏差)的范围内的概率。
如果分布描述的是来自可数集(例如整数)的值,则随机变量可以分类为离散变量。随机变量的另一种分类是连续的,如果分布涵盖了不可数集合(例如实数)中的值,则使用该分类。
来自维基百科:
在数学(尤其是概率论和统计学)中,随机变量(或随机变量)(通常)是可测量的函数,它将概率空间映射到可测量的空间。在基本统计资料中经常研究将事件的所有可能结果映射为实数的随机变量,并在科学中将其用于根据从科学实验获得的数据进行预测。除了科学应用外,还开发了随机变量来分析机会和随机事件的博弈。随机变量的用途来自它们仅捕获回答概率问题所需的数学属性的能力。
来自cnx.org:
随机变量是一个函数,它为固定条件下的随机实验的所有可能结果分配唯一的数值。随机变量不是变量,而是将事件映射到数字的函数。
通常表示为X的随机变量是结果不确定的变量。对该变量的特定结果的观察称为实现。更具体地说,它是将概率空间映射到通常称为状态空间的可测量空间的函数。随机变量是离散的(可以采用多个不同的值)或连续的(可以采用无限数量的值)。
考虑随机变量X,它是掷骰子时获得的总和。它可以取2-12的任何值(给定公平骰子的概率相等),并且在掷骰子之前结果不确定。
在我的非数学大学研究中,我们被告知随机变量是变量可以取值与概率的映射。这样可以绘制概率分布
最近,我意识到与数学家的想法有何不同。事实证明,通过随机变量,它们表示一个简单函数X:Ω→R,它采用样本空间Ω的一个元素(也就是结果,票据或个体,如上所述),并将其转换为范围内的实数R( -∞,∞)。即,上面已经适当地指出,它不是随机的,也根本没有变量。随机性通常与概率度量P一起出现,作为度量空间(Ω,P)的一部分。P将样本映射到R,类似于随机变量,但是此时间范围限制为[0,1],我们可以说随机变量将(Ω,P)转换为(R,P),因此,随机变量具有概率度量P:R-> [0,1],这样您就可以说R中的每个x发生的概率是多少。
我不知道您为什么需要这些随机变量,为什么不能首先对R的元素进行采样,但是似乎将采样转换为数值可以使我们对采样排序,绘制分布并计算期望值。我已经读过《度量理论教程》(傻瓜的度量理论),这个想法可能是数学家在脑海中更好地应用了随机变量,但是我在多余的研究中找不到它们。完全相同的文字表明您不必总是将样本转换为数字,尤其是要计算字母熵
积分不需要随机变量的任何实数值。
a sample
,我要求将其与结果区分开。为什么您需要引入一个函数并将其称为随机变量,尽管它绝对是确定性的,而根本不是变量?为什么不能立即采样结果?