Questions tagged «intuition»

寻求对统计数据进行概念或非数学理解的问题。

28
理解主成分分析,特征向量和特征值
在今天的模式识别课程中,我的教授谈到了PCA,特征向量和特征值。 我了解它的数学原理。如果要求我查找特征值等,则可以像机器一样正确地进行操作。但是我不明白。我没有达到目的。我没有感觉到它。 我坚信以下报价: 除非您可以向祖母解释,否则您并不会真正理解。 - 艾尔伯特爱因斯坦 好吧,我无法向外行或奶奶解释这些概念。 为什么要使用PCA,特征向量和特征值?什么是需要对这些概念? 您将如何向外行解释?

11
Beta发行背后的直觉是什么?
免责声明:我不是统计学家,而是软件工程师。我在统计学方面的大部分知识都来自自我教育,因此我在理解概念上仍然有很多空白,这些概念对于这里的其他人而言似乎微不足道。因此,如果答案包含较少的具体术语和更多的解释,我将非常感激。想象一下,你在跟奶奶说话:) 我试图把握性质的beta分布 -它应该用于和如何解释它在各种情况下。如果我们说的是正态分布,则可以将其描述为火车的到站时间:最经常到达的时间是准时到达的,更不常见的是早到1分钟或晚到1分钟的时间,很少有差异到达的距离平均值20分钟 均匀分配尤其描述了彩票中每张彩票的机会。二项分布可以用硬币翻转等来描述。但是,对beta分布有这样直观的解释吗? 假设和。Beta分布在这种情况下看起来像这样(在R中生成):α = 0.99α=.99\alpha=.99β= .5β=.5\beta=.5B (α ,β)B(α,β)B(\alpha, \beta) 但这实际上是什么意思?Y轴显然是概率密度,但是X轴上是什么? 我非常感谢您对本示例或任何其他示例所做的任何解释。

11
如何理解自由度?
在Wikipedia中,对统计自由度有三种解释: 在统计中,自由度数是统计的最终计算中可以自由变化的值的数目。 统计参数的估计可以基于不同数量的信息或数据。进入参数估计的独立信息的数量称为自由度(df)。通常,参数估计的自由度等于进入估计的独立分数的数量减去在参数本身的估计中用作中间步骤的参数的数量(在样本方差中为一,因为样本均值是唯一的中间步骤)。 在数学上,自由度是随机向量的域的维数,或本质上是“自由”分量的数量:在完全确定向量之前,需要知道多少个分量。 粗体字是我不太了解的内容。如果可能,一些数学公式将有助于阐明这一概念。 这三种解释是否也彼此一致?

16
统计测试中p值和t值的含义是什么?
在修完统计学课程,然后试图帮助同学后,我注意到一个启发很多总部敲门鼓的科目正在解释统计学假设检验的结果。看来学生很容易学习如何执行给定测试所需的计算,但是却迷上了解释结果的过程。许多计算机化工具以“ p值”或“ t值”报告测试结果。 您如何向大学生学习统计学第一门课程解释以下几点: “ p值”相对于要检验的假设是什么意思?在某些情况下应该寻找高p值或低p值吗? p值和t值之间是什么关系?


10
您将如何向仅理解均值的人解释协方差?
……假设我能够以一种直观的方式(直观地理解“方差”)或说:他们是数据值与“均值”的平均距离,并且方差是平方单位,我们取平方根以保持单位不变,这称为标准偏差。 让我们假设这是“接收者”明确表达和(希望)理解的。现在什么是协方差?如何在不使用任何数学术语/公式的情况下用简单的英语解释它?(即,直观的解释。;) 请注意:我确实知道该概念背后的公式和数学公式。我希望能够以一种易于理解的方式“解释”相同的内容,而无需包括数学运算。即“协方差”到底是什么意思?

7
中心极限定理有什么直观的解释?
在几种不同的情况下,我们调用中心极限定理来证明我们要采用的任何统计方法(例如,通过正态分布近似二项式分布)。我了解关于该定理为何成立的技术细节,但是我刚刚想到,我并不真正理解中心极限定理背后的直觉。 那么,中心极限定理背后的直觉是什么? Layman的解释将是理想的。如果需要一些技术细节,请假设我了解pdf,cdf,随机变量等的概念,但不了解收敛概念,特征函数或与度量理论有关的知识。


9
从底部到顶部解释马氏距离?
我正在研究模式识别和统计,几乎每本书我都涉及马哈拉诺比斯距离的概念。这些书给出了一些直观的解释,但仍然不足以让我真正真正了解正在发生的事情。如果有人问我“马氏距离是多少?” 我只能回答:“这是一件好事,它可以测量某种距离” :) 这些定义通常还包含特征向量和特征值,与马氏距离之间的连接有点麻烦。我了解特征向量和特征值的定义,但是它们与马氏距离有何关系?它与更改线性代数等的基数有关吗? 我还阅读了有关该主题的以下先前问题: 什么是马氏距离,如何将其用于模式识别? 高斯分布函数和马哈拉诺比斯距离(Math.SE)的直观解释 我也读过这个解释。 答案是好的,画面不错,但我仍然没有真正得到它。我有一个想法,但它仍然在黑暗中。有人可以给出“您将如何向您的祖母解释”的解释,以便我最终将其总结起来,而再也不会怀疑马哈拉诺比斯距离是多少?:)它来自哪里,为什么? 更新: 以下是有助于理解Mahalanobis公式的内容: https://math.stackexchange.com/questions/428064/distance-of-a-test-point-from-the-center-of-an-椭球

3
为什么我们需要西格玛代数来定义概率空间?
我们进行了一个随机实验,以不同的结果形成样本空间 Ω,Ω,\Omega,我们感兴趣地观察了某些模式(称为事件 F.F.\mathscr{F}. 西格玛代数(或西格玛场)由可以分配概率度量PP\mathbb{P}的事件组成。满足某些属性,包括包含空集∅∅\varnothing和整个样本空间,以及描述与维恩图的并集和相交的代数。 概率被定义为之间的函数σσ\sigma代数和区间[0,1][0,1][0,1]。总的来说,三元组(Ω,F,P)(Ω,F,P)(\Omega, \mathscr{F}, \mathbb{P})形成了一个概率空间。 有人可以用简单的英语解释如果我们没有σσ\sigma代数的情况,为什么概率大厦会崩溃?它们只是被那个不可能的书法“ F”楔入中间。我相信它们是必要的;我看到一个事件与结果不同,但是如果没有σσ\sigma代数,会发生什么错误呢? 问题是:在哪种类型的概率问题中,包括σσ\sigma代数的概率空间的定义成为必要吗? 达特茅斯大学网站上的此在线文档提供了简单易懂的英语说明。这个想法是旋转指针在单位周长的圆周上逆时针旋转: 我们首先构造一个微调器,它由一个单位圆周的圆和一个指针组成,如图所示。我们在圆上选择一个点并将其标记为000,然后在圆上的每个其他点标记xXx,从000到该点的距离为逆时针方向。实验包括旋转指针并记录指针尖端处的点的标签。我们让随机变量XXX表示该结果的值。样品空间显然是间隔[0,1)[0,1个)[0,1)。我们想构建一个概率模型,其中每个结果均可能发生。daccess-ods.un.org daccess-ods.un.org如果我们像进行有限数量的可能结果那样进行实验,则必须将概率000分配给每个结果,因为否则,所有可能结果的概率之和将不会等于1。(实际上,对无数个实数求和是一件棘手的事情;特别是,为了使这种和具有任何意义,最多最多可以有许多个求和数可以不同于000)但是,如果所有分配的概率都是000,那么总和应该是 000,而不是11个1。 因此,如果我们为每个点分配任何概率,并且给定一个(无数个)无穷个点,那么它们的总和将>1>1个> 1。

9
数值示例,以了解期望最大化
我试图很好地掌握EM算法,以便能够实现和使用它。我花了一整天的时间阅读该理论和一篇论文,其中使用EM使用来自雷达的位置信息来跟踪飞机。老实说,我认为我不完全理解基本思想。有人可以给我指出一个数值示例,该示例显示EM的几次迭代(3-4),以解决一个更简单的问题(例如估算高斯分布的参数或正弦序列的序列或拟合直线)。 即使有人可以将我指向一段代码(带有合成数据),我也可以尝试单步执行代码。

3
单位根的直观解释
在单位根测试的上下文中,您将如何直观地解释什么是单位根? 我在想一种解释方式,就像我在这个问题上已经建立的那样。 关于单位根的情况是,我知道(顺便说一句)单位根测试用于测试时间序列中的平稳性,仅此而已。 您将如何向外行人或学习过非常基本的概率和统计学课程的人解释它? 更新 我接受了胡布的回答,因为这最能反映我在这里提出的要求。但是我敦促所有来这里的人也阅读帕特里克和迈克尔的答案,因为它们是理解单位根的自然的“下一步”。他们使用数学,但是以非常直观的方式。


4
如何直观地解释什么是内核?
许多机器学习分类器(例如支持向量机)允许指定一个内核。解释内核是什么的直观方式是什么? 我一直在思考的一个方面是线性和非线性内核之间的区别。简单来说,我可以说“线性决策函数”是“非线性决策函数”。但是,我不确定将内核称为“决策函数”是否是一个好主意。 有什么建议吗?


By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.