Questions tagged «philosophical»

有关统计学或概率哲学的问题:概率的解释,常客/贝叶斯统计学的基础问题等。请勿将此标记用于一般的推测性问题(又称“哲学性”)。

2
置信区间实际上是否可以衡量参数估计的不确定性?
我正在阅读统计学家威廉·布里格斯(William Briggs)的博客文章,以下说法至少使我感兴趣。 你是怎么做的? 什么是置信区间?当然,这是一个方程式,它将为您提供数据间隔。旨在提供对参数估计值不确定性的度量。现在,严格按照频率论者的理论(甚至可以假设它是真实的),您可以说的关于现有CI的唯一一件事就是参数的真实值位于其中或不存在。这是重言式,因此始终如此。因此,CI根本无法提供不确定性的度量:实际上,计算不确定性是无用的。 链接:http://wmbriggs.com/post/3169/

3
固定效果何时真正固定?
考虑以下类型的线性不可观察效应模型: 其中,是不可观察但时不变的特征,是误差,和分别索引个人观察和时间。固定效应(FE)回归中的典型方法是通过单个假人(LSDV)/去义或通过首次求差来消除。 Ç ë 我吨Ç 我ÿ我Ť= X我Ťβ+ c一世+ e我Ťyit=Xitβ+ci+eity_{it} = X_{it}\beta + c_{i} + e_{it}CccËee一世iiŤttC一世cic_{i} 我一直想知道的是:何时真正被“修复”?C一世cic_{i} 这可能是一个琐碎的问题,但由于其背后的原因,让我举两个例子。 假设我们采访的人今天并要求她的收入,重量等,所以我们得到我们的。在接下来的10天里,我们去找那个人并且每天再次与她面谈,因此我们有关于她的面板数据。我们是否应将这10天未观察到的特征视为固定的,以确保它们将来会在其他某个时候发生变化?在10天之内,她的个人能力可能不会改变,但是随着年龄的增长,这种能力就会改变。或以一种更极端的方式问:如果我每天在10个小时内每小时采访一次此人,那么她的“未察觉”特征很可能会在“样本”中得到固定,但这有什么用呢?XXX 现在,假设我们从一个人的生命开始到生命终结,每个月都要进行约85年的采访。这段时间将保持什么固定状态?出生地,性别和眼睛颜色最有可能,但除此之外,我几乎没有别的想法。但更重要的是:如果某项特征在她的生活中的某个时刻发生了变化,但变化却无限小,该怎么办?然后,它不再是固定的效果,因为在实践中,此特性是准固定的,它已经改变了。 从统计角度来看,什么是固定效果是相对清楚的,但是从直觉角度来看,这是我很难理解的。也许其他人以前有过这些想法,并提出了关于何时固定效应确实是固定效应的争论。我非常感谢您对此主题的其他想法。

6
如果您使用使最大化的点估计,那对您的哲学有何看法?(是常客还是贝叶斯或其他?)
如果有人说 “该方法对最大使用参数的MLE点估计,因此它是常客的;而且它不是贝叶斯。”P (x | θ )P(x|θ)\mathrm{P}(x|\theta) 你同意吗? 背景资料:最近我读了一篇自称是常客的论文。我不同意他们的主张,充其量我感到模棱两可。本文未明确提及MLE(或MAP)。他们只进行点估计,就好像这个点估计是正确的一样继续进行。他们不对这个估计量的采样分布进行任何分析,或者类似的分析;该模型非常复杂,因此可能无法进行此类分析。他们也不在任何时候使用“后”一词。他们只是将这一点的估计值作为票面价值,然后转到他们感兴趣的主要主题-推断丢失的数据。我认为他们的方法没有任何东西可以说明他们的哲学。他们可能打算成为常客(因为他们觉得有必要在袖子上穿上自己的哲学),但是他们的实际做法却很简单/方便/懒惰/模棱两可。我现在要说的是,这项研究实际上没有任何哲学依据。相反,我认为他们的态度更加务实或方便: “我已经观察到数据,并且希望估计一些缺失的数据。有一个参数控制着和之间的关系。我真的不在乎只是作为达到目的的一种手段。如果我有一个的估计,它将使从预测变得更加容易。我会选择一个的点估计,因为它很方便,尤其是我会选择最大化的。”ž θ žXxxžzzθθ\thetažzzθ θ ž X θ θ P(X | θ )Xxxθθ\thetaθθ\thetazzzxxxθθ\thetaθ^θ^\hat{\theta}P(x|θ)P(x|θ)\mathrm{P}(x|\theta) 一个无偏估计量的想法显然是一个频率主义的概念。这是因为它不以数据为条件,并且描述了一个很好的属性(无偏),该属性可以容纳参数的所有值。 在贝叶斯方法中,数据和参数的作用有点相反。特别是,我们现在以观察到的数据为条件,并继续对参数的值进行推断。这需要先验。 到目前为止,一切都很好,但是MLE(最大似然估计)在哪里适合呢?我给人的印象是,很多人认为它是频率论者(或更确切地说,它不是贝叶斯主义者)。但是我觉得它是贝叶斯方法,因为它涉及获取观察到的数据,然后找到使最大化的。MLE隐式地使用统一的先验并以数据为条件,并使最大化。公平地说,MLE看起来既是频率派的又是贝叶斯的?还是每个简单的工具都必须完全属于这两种类别之一?P (p 一个ř 一米ë 吨ë [R | d 一吨一)P(data|parameter)P(data|parameter)P(data | parameter)P(parameter|data)P(parameter|data)P(parameter | data) MLE是一致的,但我认为一致性可以表示为贝叶斯思想。给定任意大的样本,估计值收敛于正确答案。对于参数的所有值,语句“估计值将等于真实值”成立。有趣的是,如果您以观察到的数据为条件,则该语句也成立,从而使其成为贝叶斯式。除了MLE之外,还有其他有趣的地方,但对于无偏估计器却没有。 这就是为什么我认为MLE是方法中的“最高级贝叶斯”方法,可以说是“频繁方法”。 无论如何,大多数频率属性(例如无偏)都适用于所有情况,包括有限的样本量。一致性仅在不可能的情况下保持有效(一个实验中有无限个样本),这一事实表明一致性并不是一个有用的属性。 给定一个现实的(即有限的)样本,是否存在一个适用于MLE的Frequentist属性?如果不是这样,那么MLE并不是真正的频率偏高者。

2
贝叶斯方法本质上是顺序的吗?
也就是说,要使用频繁性方法进行顺序分析(您无法提前确切地知道要收集多少数据),需要特别注意;您不能仅在p值变得足够小或置信区间变得足够短之前收集数据。 但是,在进行贝叶斯分析时,这是否值得关注?我们可以自由地做诸如收集数据之类的事情,直到可信间隔变得足够小时吗?

3
统计的未来
当我在关于数学中尚未解决的问题的公开演讲中时,我想到了这个问题。众所周知,仍然存在许多未解决的数学问题。这让我开始思考统计中尚未解决的问题。在花了一些时间在Google上搜索此主题之后,我认为对此问题没有相对详细的讨论。因此,我真的很想听听人们对此的看法。统计作为一门学科去哪里了?我们应该花更多的时间来改进理论还是应该专注于如何分析从各种科学实验中收集的特定数据?任何对此的想法将不胜感激。谢谢!

5
置信区间和概率-此语句中的错误在哪里?
如果有人发表如下声明: “总体而言,与不接触烟的非吸烟者相比,接触环境烟的非吸烟者患冠心病的相对风险为1.25(95%置信区间为1.17至1.32)。” 整个人口的相对风险是多少?有多少东西与冠心病有关?在可以测试的大量事物中,实际上很少与冠心病有关,因此,任意选择的任何特定事物与之相连的机会都将大大减少。因此,我们可以说该人群的相对风险为1。但是所引用的间隔不包含值1。因此,或者两者之间确实存在联系,而这两者的可能性正在逐渐减小,或者这是其中之一。不包含参数的间隔的5%。由于后者比前者更有可能是我们应该假设的。因此,适当的结论是,该数据集几乎可以肯定是该人群的非典型数据, 当然,如果有某种依据可以假定超过5%的疾病与冠心病有关,那么统计中可能会有一些证据支持环境烟雾就是其中之一的说法。常识表明这不太可能。 他们的推理有什么错误(因为所有卫生组织都同意,有大量有关二手烟破坏作用的文献)?是因为他们的前提是“在可以测试的大量事物中,实际上很少与冠心病有关”?这句话对于任何随机选择的因素(例如,一个人拥有几只患有冠状动脉疾病的狗)可能都是正确的,但二手烟和冠心病的先验概率要比“任何随机因素”高得多。 这是正确的推理吗?还是还有别的东西?

4
有关因果推理的因果哲学的在线资源
您能推荐一些流行病学家/生物统计学家学习因果关系/因果推理原理的有趣且有用的书籍,文章,论文,在线教程/课程等吗? 我对从Epi和Biostats框架实际进行因果推理非常了解,但是我想了解一些基础知识并推动这项工作。例如,据我了解,休ume首先谈到了可以被解释为反事实的想法。 我基本上没有任何哲学方面的培训或经验,因此我需要相对入门的内容,但是我也对更复杂但重要/基础的文本/作者的建议感兴趣(但请指出它们不是入门性的)。 我希望对于交叉验证而言,这不是太题外话,但我希望你们中的某些人和我以前一样在同一条船上,并且能够共享自己喜欢的资源。

4
当前辩论对统计意义的影响
在过去的几年中,各种各样的学者提出了一个有害的科学假设检验问题,称为“研究者自由度”,这意味着科学家在分析过程中有很多选择偏向于p值<5%的发现。例如,这些模棱两可的选择包括要包含的情况,被归类为异常的情况,运行大量的模型规范,直到出现某种情况,不发布无效结果,等等。(引发心理学争论的论文在这里,看到一个受欢迎的石板条和后续辩论安德鲁·盖尔曼在这里,和时代杂志还谈到了这个话题在这里。) 首先,一个澄清问题: 《时代》杂志写道, “ 0.8的幂表示经过检验的十个真实假设中,只有两个被排除在外,因为其影响未在数据中得到体现。” 我不确定这是否适合我在教科书中找到的幂函数的定义,这是拒绝空值作为参数的函数的可能性。使用不同的我们具有不同的功能,因此我不太理解上面的引用。θθθ\thetaθθ\theta 其次,一些研究意义: 在我的政治科学/经济学领域,学者只是用尽了所有可用的国家/地区年度数据。因此,我们不应该在这里摆弄样品吗? 是否可以仅通过学科中的其他人将重新测试您的论文并由于没有可靠结果而立即将您击倒这一事实来解决运行多个测试但仅报告一个模型的问题?预见到这一点,我这一领域的学者更有可能包括一robustness check节,他们表明多个模型规范不会改变结果。这够了吗? 安德鲁·盖尔曼(Andrew Gelman)和其他人指出,无论数据如何,总是有可能找到并发布一些并非真正存在的“模式”。但是,考虑到任何经验的“模式”都必须得到理论的支持,并且学科内的竞争理论只会进行辩论/竞赛,以找出哪个阵营能够找到更多的“模式”,因此这不必担心。在各个地方。如果某个模式确实是虚假的,那么当其他样本/设置中没有类似的模式时,后面的理论将很快被推翻。这不是科学的进步吗? 假设当前期刊对无效结果的趋势实际上将会蓬勃发展,是否有办法让我们将所有无效结果和肯定结果汇总在一起,并推断它们都试图检验的理论?

1
P值和似然原理
这个问题在课堂上出现:如果我们使用p值评估实验中的假设,那么我们不遵守似然原理的哪一部分:充分性或条件性? 我的直觉是说充分性,因为计算p值取决于实验的未观察结果,而充分性似乎在单个实验中处理的观察更多,而条件性似乎对不同的实验进行更多的处理。

3
贝叶斯何时(以及为什么)拒绝有效的贝叶斯方法?[关闭]
已关闭。这个问题需要细节或说明。它当前不接受答案。 想改善这个问题吗?添加详细信息并通过编辑此帖子来澄清问题。 3年前关闭。 从我阅读的内容以及对我在此处提出的其他问题的答案来看,许多所谓的常客方法在数学上都对应于特殊情况(所谓“频繁主义者”在数学上相对应,我不在乎它们是否在数学上相对应,我只是在乎它是否在数学上相对应)。贝叶斯方法(对于那些反对者,请参阅此问题底部的注释)。这个对相关问题(不是我的问题)的回答支持以下结论: 大多数Frequentist方法都具有贝叶斯等效项,在大多数情况下,其结果基本相同。 注意,在下文中,数学上相同意味着给出相同结果。如果您描述两种方法的特征,可以证明它们总是能得到与“不同”相同的结果,那是您的权利,但这是一种哲学判断,而不是数学判断或实践判断。 但是,许多自称为“贝叶斯方法”的人似乎拒绝在任何情况下都使用最大似然估计,尽管这是(数学上)贝叶斯方法的特例,因为它是“频率论方法”。显然,与贝叶斯主义者相比,贝叶斯主义者还使用有限/有限数量的分布,即使从贝叶斯观点来看,这些分布在数学上也是正确的。 问题:从贝叶斯的角度来看,贝叶斯何时,为什么拒绝在数学上正确的方法?有没有不是“哲学上的”理由吗? 背景/上下文:以下是我对CrossValidated上一个问题的回答和评论中的引文: 贝叶斯与频繁主义者辩论的数学基础非常简单。在贝叶斯统计中,未知参数被视为随机变量。在常客统计中,它被视为固定要素... 从以上所述,我可以得出以下结论:(从数学上来说)贝叶斯方法比常客方法更通用,在某种意义上,常客模型满足所有与贝叶斯模型相同的数学假设,反之则不然。但是,相同的答案也认为我从以上得出的结论是错误的(以下是我的结论): 尽管常数是随机变量的特例,但我还是会得出结论,贝叶斯主义更为笼统。简单地将随机变量折叠成一个常数,就不会从贝叶斯函数得到频繁的结果。区别更加深刻... 根据个人喜好...我不喜欢贝叶斯统计使用可用分布的有限子集。 另一位用户,在他们的答案,说正好相反,贝叶斯方法都比较一般,但奇怪的是我能找到的,为什么这可能是这种情况的最好理由是以前的答案,有人作为一个训练有素的频率论定。 数学上的结果是,频繁主义者认为概率的基本方程式有时仅适用,而贝叶斯主义者则认为它们总是适用。因此,他们认为相同的方程式是正确的,但是在通用性上却有所不同……贝叶斯严格比频率论更为通用。由于任何事实都可能存在不确定性,因此可以为任何事实分配概率。特别是,如果您正在处理的事实与现实世界的频率有关(无论是您预测的还是数据的一部分),那么贝叶斯方法就可以像对待任何其他现实世界的事实一样考虑和使用它们。因此,频频主义者觉得他们的方法适用于贝叶斯方法的任何问题也可以自然地解决。 从以上答案中,我得到的印象是,至少有两个常用的贝叶斯术语的不同定义。首先,我将其称为“数学贝叶斯”,它涵盖了所有统计方法,因为它包含了恒定RV和非恒定RV的参数。然后是“文化上的贝叶斯”方法,它拒绝了某些“数学上的贝叶斯”方法,因为这些方法是“频繁的”(即出于对参数的个人仇恨,有时将其建模为常数或频率)。对上述问题的另一个答案似乎也支持这一推测: 还要注意的是,两个营地所使用的模型之间存在很大的差异,这与已完成的事情比可以完成的事情更多相关(即,一个营地传统上使用的许多模型可以由另一个营地证明))。 因此,我想表达我的问题的另一种方式是:如果文化贝叶斯人拒绝许多数学上的贝叶斯方法,为什么他们会称自己为贝叶斯人?为什么他们拒绝这些数学上的贝叶斯方法?对于最经常使用这些特定方法的人来说,这是个人仇恨吗? 编辑:如果两个对象具有相同的属性,则无论它们如何构造,在数学上都是等效的。例如,我可以想到至少五种不同的方式来构造虚部。然而,关于虚数的研究至少没有五种不同的“思想流派”。实际上,我相信只有一个人,即研究他们属性的那个人。对于那些反对使用最大似然来获得点估计与使用最大先验和统一先验来获得点估计的人不同,因为所涉及的计算是不同的,我承认它们在哲学意义上是不同的,但是他们总是在多大程度上一世ii给出相同的估计值,它们在数学上是等效的,因为它们具有相同的属性。哲学上的差异可能与您个人相关,但与该问题无关。 注意:此问题最初具有统一先验的MLE估计和MAP估计的不正确表征。

1
对回归变量进行条件处理与将其视为固定条件有什么区别?
有时我们假设回归变量是固定的,即它们是非随机的。我认为这意味着我们所有的预测变量,参数估计等都是无条件的,对吧?我什至可能已经不再是随机变量了吗? 另一方面,如果我们接受经济学家所说的大多数回归变量是随机的,因为没有外界的力量在进行某种实验的基础上就决定了它们。然后,计量经济学家会根据这些随机回归变量进行调整。 这与将它们视为固定的有何不同? 我了解什么是调节。从数学上讲,这意味着我们将所有观察和推论都以该组特定的回归器为条件,并且没有雄心勃勃地说,如果我们看到回归器的实现不同,则推论,参数估计,方差估计等将是相同的。时间序列的症结所在,每个时间序列只能看到一次)。 但是,要真正掌握固定回归变量与随机回归变量的条件之间的区别,我想知道这里是否有人知道一个对固定回归变量有效但在随机回归时会分解的估计或推断过程的示例视情况而定)。 我期待看到这些示例!

3
频繁的推理和对观测条件的限制(来自Wagenmakers等的示例)
我不是统计学专家,但是我认为对于概率的“常客”或“贝叶斯”解释是否是“正确”的说法存在分歧。来自Wagenmakers等。al p。183: 考虑均值和width的均匀分布。从该分布中随机抽取两个值,分别标记最小的和最大的,并检查均值是否位于和之间。如果此过程重复很多次,则在一半情况下,平均将位于和之间。因此,给出的50%频繁置信区间。但假设对于特定抽签,且μμ\mu1个11sss升llμμ\musss升llμμ\musss升ll(小号,升)(s,l)(s, l)μμ\mus =9.8s=9.8s = 9.8l =10.7l=10.7l = 10.7。这些值之间的差为,这覆盖了分布范围的9/10。因此,对于和这些特定值,我们可以对 100%的置信度,即使常客的置信区间会让您相信您应该仅拥有50%的置信度。0.90.90.9sss升lls &lt; μ &lt;ls&lt;μ&lt;ls < \mu < l 真的有人相信在这种情况下只有50%的信心吗? 我想更一般地说,这本书似乎是在说常客不能表达一个有条件的主张,例如“给定且 , 的概率为1”。条件是否暗含贝叶斯推理是真的吗?s = 9.8s=9.8s = 9.8l = 10.7l=10.7l = 10.7s &lt; μ &lt; ls&lt;μ&lt;ls<\mu<l
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.