Questions tagged «philosophical»

有关统计学或概率哲学的问题:概率的解释,常客/贝叶斯统计学的基础问题等。请勿将此标记用于一般的推测性问题(又称“哲学性”)。

4
每天的概率仅仅是对付未知数的一种方式(这里不谈论量子物理学)吗?
似乎在日常概率中(不是量子物理学),概率实际上只是未知数的替代物。以掷硬币为例。我们说这是“随机的”,头改变了50%,尾巴改变了50%。但是,如果我确切地知道硬币的密度,大小和形状;空气密度 硬币翻转了多少力;该部队确切地放置在哪里;硬币到地板的距离;等,使用基本物理学,我无法以100%的精度预测它会落在头上还是尾巴上?如果是这样,在这种情况下概率不是我处理不完整信息的一种方式吗? 如果我随机播放一副纸牌(这是我对此的考虑),那不是同一回事吗?我将牌的顺序视为随机的,因为我不知道顺序是什么,但并不是我抽出的第一张牌是黑桃A真的有1/52的可能性—要么100%是黑桃王牌或100%的王牌不是。 如果掷骰子并重排牌组不是真正随机的,那么计算机随机数生成器也不是随机的,因为如果我知道算法(可能还有其他一些变量),我也会知道数量会是多少? 在此先感谢所有花时间回答的人,尤其是像我这样的非数学家提出的新手问题。我不想继续进行reddit,因为其中很多人都伪装成有知识的人,却没有。其他一些元注释: 首先,我知道已经回答了一个类似的问题Random vs Unknown。所以,请不要让我参考。我认为我要提出的问题要狭窄得多,并且要以更简单的数学为基础。 其次,我不是数学家,所以请坚持使用简单的示例和非技术性的语言(除非绝对必要,在这种情况下,请假装自己是在向艺术史专业的中等学识的大四学生解释自己)。 第三,我对基本概率有很好的理解。这主要是因为我玩很多扑克,但是我了解轮盘,骰子,彩票等其他赌博游戏的赔率是如何工作的。同样,这是非常基本的东西,因此请避免量子物理学,如果可以避免的话。 第四,听起来并不冷酷,但我希望人们讨论我的问题的答案,而不是告诉我他们对我的了解还多。我之所以这样说,是因为我看到人们试图通过故意使用不必要的高技术语言来“打败”某人,并将另一个人的词汇混淆,而不是辩论实际问题。例如,与其说“应该摄入一些乙酰水杨酸”,不如说“应该服用一些阿司匹林”。

5
可能性原则“确实”重要的示例?
是否有一个例子,两个具有成比例可能性的不同可辩证检验会导致一个明显不同(且同样可辩驳)的推论,例如,p值相差一个数量级,但替代方法的功效却相似? 我看到的所有示例都是非常愚蠢的,将二项式与否定二项式进行比较,第一个的p值为7%,第二个3%的p值是“不同的”,仅在对任意阈值做出二元决策的范围内显着性(例如5%)(顺便说一句,这是一个相当低的推论标准),甚至不用费心去看能力。例如,如果我将阈值更改为1%,则两者都会得出相同的结论。 我从未见过一个示例,它会导致明显不同且可辩驳的推断。有这样的例子吗? 我之所以问是因为,我已经在这个主题上花了很多笔墨,好像“可能性原则”是统计推断基础中的基本要素。但是,如果最好的例子是像上面的例子那样愚蠢的例子,则该原理似乎完全无关紧要。 因此,我正在寻找一个非常有说服力的示例,其中如果不遵循LP,则证据权重将在给定一项检验的情况下绝大多数指向一个方向,而在另一种具有成比例可能性的检验中,证据权重将压倒性地指向相反的方向,这两个结论看起来都是明智的。 理想情况下,一个能证明我们可以有任意相距甚远,但是合理的,解答,诸如与测试p=0.1p=0.1p =0.1与p=10−10p=10−10p= 10^{-10}具有比例似然和等效功率,以检测相同的替代。 PS:布鲁斯的答案根本没有解决这个问题。

8
统计不是数学吗?
统计是数学吗? 鉴于所有数字都是由数学系教授的,并且您获得了数学学分,我想知道人们说这些数字时只是半开玩笑,比如说这只是数学的一小部分,还是只是应用数学。 我想知道像统计之类的不能在基本公理上构建所有内容的东西是否可以算作数学。例如,值是为了理解数据而出现的概念,但这不是更基本的原理的逻辑结果。ppp

10
零假设是哪一个?科学理论,逻辑学和统计学之间的冲突?
我很难理解设定原假设的基本逻辑。在这个答案中,显然公认的命题被陈述为:零假设是不会有影响的假设,一切都会保持不变,也就是说,在阳光下没有新事物。 然后,另一种假设就是您试图证明的假设,例如,一种新药兑现了诺言。 现在从科学理论和一般逻辑学来的我们知道,我们只能伪造命题,我们无法证明某些东西(没有数量的白色天鹅可以证明所有天鹅都是白色的,但是一只黑天鹅可以证明它)。这就是为什么我们试图证明原假设的原因,这不等于证明替代假设-这就是我开始怀疑的地方-我将举一个简单的例子: 假设我想找出窗帘后面是哪种动物。不幸的是,我无法直接观察到该动物,但是我进行了一项测试,该测试使我知道了该动物的腿数。现在,我有以下逻辑推理: 如果动物是狗,那么它将有4条腿。 如果我进行测试并发现它有4条腿,则不能证明它是狗(可以是马,犀牛或任何其他4条腿的动物)。但是,如果我发现它没有四只脚,则可以肯定地证明它不能是狗(假设是健康的动物)。 转化为药物有效性,我想了解幕后药物是否有效。我唯一会得到的数字就是给我效果的数字。如果效果是肯定的,则没有任何证据(4条腿)。如果没有效果,我就证明该药的有效性。 我认为所有这些都与常识相反,唯一有效的零假设必须是 该药物有效(即:如果该药物有效,您将看到效果)。 因为这是我唯一可以反驳的事情-直到下一轮我会尝试更加具体,依此类推。因此,是由零假设来说明影响,而替代假设则是默认假设(无影响)。 为什么统计检验似乎使它倒退? PS:你甚至不能否定上述假设得到有效等价假说,所以你不能说“的药物是不是有效”的零假设,因为只有逻辑上等同的形式是“如果你看到没有效果的药物会不会是有效”一词,却无济于事,因为现在得出的结论就是您想要找到的! PPS:只是为了阅读到目前为止的答案,以供澄清:如果您接受科学理论,则只能伪造陈述而不能证明它们,唯一在逻辑上一致的是选择零假设作为新理论-然后可以伪造的。因为如果您伪造现状,您将一无所获(现状被反驳,但新理论远未得到证明!)。而且,如果您不能伪造它,那么您也不会处于更好的位置。

4
统计直觉/数据意义
我是一名大二学生,正在学习数学,并且我一直在与一位教授谈论数学能力和统计能力之间的差异。他提出的主要区别之一是“数据意识”,他将其解释为技术能力的结合,同时在一组我非正式地称为“常识性约束”的范围内操作,即在其中看不到问题的现实很多理论。这是我正在谈论的一个示例,该示例出现在Gowers的博客中: 在英国的一些地区,警察收集了有关道路交通事故发生地点的统计信息,确定了交通事故黑点,并在此处放置了高速摄影机,并收集了更多的统计信息。在安装了测速摄像机之后,这些黑点的事故数量肯定会下降。这是否最终表明测速摄像机可以改善道路安全性? 在谈判博弈中主张随机策略的同一个人基本上已经知道了该问题的答案。他说不,因为如果您选择极端情况,那么如果您再次运行实验,您会希望它们不会那么极端。因为没有太多要说的了,所以我决定快速解决这个问题。但是我告诉人们我有一个计划,那就是做一个假的心灵感应实验。我会让他们猜测20次抛硬币的结果,我会尝试将它们抛向心灵。然后,我会选择表现最好的三个和最差的三个,然后再次掷硬币,这次请最好的帮助我将最坏的答案传给我。人们可以轻松地看到,预期性能将得到改善,并且与心灵感应无关。 我要问的是如何通过有关该主题的任何出版物(如果有的话)或通过其他用户发现对开发此技能有帮助的方式,进一步了解这种“数据意义”。如果这个问题需要澄清,我感到抱歉。如果是这样,请发表您的问题!谢谢。

5
在实践中,“仅根据比例的乘法常数来定义可能性”是什么意思?
我正在阅读一篇论文,作者从最大似然估计的讨论到贝叶斯定理,似乎是对初学者的介绍。 作为一个可能性示例,它们从二项分布开始: p(x|n,θ)=(nx)θx(1−θ)n−xp(x|n,θ)=(nx)θx(1−θ)n−xp(x|n,\theta) = \binom{n}{x}\theta^x(1-\theta)^{n-x} 然后登录双方 ℓ(θ|x,n)=xln(θ)+(n−x)ln(1−θ)ℓ(θ|x,n)=xln⁡(θ)+(n−x)ln⁡(1−θ)\ell(\theta|x, n) = x \ln (\theta) + (n-x)\ln (1-\theta) 具有以下基本原理: “因为可能性仅被定义为比例的乘性常数(或对数似然的加性常数),所以我们可以通过降低二项式系数并写出对数似然来代替似然来重新定标。” 数学上是有道理的,但我不明白“似然仅定义为比例乘性常数”的含义,以及这如何使二项式系数下降并从变为\ ell(\ theta | x,n)。p(x|n,θ)p(x|n,θ)p(x|n,\theta)ℓ(θ|x,n)ℓ(θ|x,n)\ell(\theta|x,n) 在其他问题(此处和此处)中也出现了类似的术语,但实际上仍不清楚可能的定义是什么,或者使信息达到可乘的常数。有可能用外行的术语解释吗?


6
当许多重要的事情都是一次性的事情时,为什么统计有用?
我不知道是否只有我一个人,但我对总体统计数据非常怀疑。我可以在骰子游戏,扑克游戏等中理解它。非常小,简单,主要是独立的重复游戏就可以了。例如,落在其边缘的硬币足够小,可以接受正面或反面着陆的概率约为50%。 玩$ 10的扑克游戏,争取95%的胜利。但是,如果您一生的积蓄和更多金额取决于您是否赢得胜利?知道您在那种情况下有95%的时间会获胜将如何对我有所帮助?期望值并没有太大帮助。 其他例子包括危及生命的手术。根据现有数据,如何知道生存率为51%与99%的生存率有什么关系?在这两种情况下,我认为医生告诉我的内容对我来说都没有关系,我会坚持下去。如果实际数据是75%,他还可以告诉我(除非遵守道德和法律),否则生存的机率是99.99999%,所以我会感觉更好。换句话说,除了二项式之外,现有数据无关紧要。即使那样,如果我最终死了,生存率也不会有99.99999%的问题。 还有,地震的可能性。平均每隔x(x> 100)年发生一次强地震无关紧要。我不知道地震是否会在我的一生中发生。那么,为什么它甚至是有用的信息呢? 举一个不那么严重的例子,例如,我所去过的地方中,我爱过的地方中有100%位于美洲,对我去过欧洲的地方中的100%无动于衷,而对我所去过的地方中的100%却讨厌去过亚洲。现在,这绝不意味着我不会在下一次旅行中在亚洲找到自己喜欢的地方,也不会在欧洲讨厌或对美国无动于衷,只是因为统计数据无法捕获我所有的信息,即使我去过所有大陆的x%以上,我也可能永远无法捕捉到我需要的所有信息。只是因为在我尚未去过的那些大陆的1-x%中存在未知数。(请随意用其他百分比替换100%)。 我知道没有办法暴力破解所有内容,并且在许多情况下您都必须依靠统计信息,但是我们如何才能相信统计信息在我们的一发不可收拾的情况下会有所帮助,尤其是当统计信息基本上不推断为异常事件时? 有什么见解可以克服我对统计的怀疑吗?

2
统计景观
有没有人对各种统计方法写过简短的调查?初步估计,您具有常客和贝叶斯统计。但是,当您仔细观察时,还可以使用其他方法,例如似然论和经验贝叶斯。然后在组内进行细分,例如贝叶斯统计中的主观贝叶斯目标贝叶斯等。 调查文章会很好。如果包含图表,那就更好了。

4
关于乔治·博克斯(George Box),加利特·斯穆利(Galit Shmueli)和科学方法?
(这个问题似乎更适合于哲学SE。我希望统计学家可以澄清我对Box和Shmueli陈述的误解,因此我将其张贴在这里)。 ARIMA名望的George Box说: “所有模型都是错误的,但有些是有用的。” Galit Shmueli在她著名的论文“ To Explain or Predict”中指出(并引用了其他同意她的观点): 解释和预测并不相同,尽管某些模型在预测方面做得不好,但有些模型在解释方面做得很好。 我觉得这些与原则有些矛盾。 如果模型预测不好,是否有用? 更重要的是,如果模型能够很好地解释(但不一定能很好地预测),那么它在某种程度上必须是正确的(即没有错)。那么,这与Box的“所有模型都错了”又有什么关系呢? 最后,如果一个模型能够很好地解释但不能很好地预测,那么它如何科学?大多数科学标界标准(验证论,证伪论等)都暗示科学陈述必须具有预测能力,或者口语化:只有经过实证检验(或证伪)的理论或模型才是正确的。必须预测未来的结果。 我的问题: Box的陈述与Shmueli的观点是否确实矛盾,或者我是否缺少某些东西,例如,一种没有预测能力的模型仍然有用吗? 如果Box和Shmueli的陈述不矛盾,那么对一个模型错误并不能很好地预测却仍然具有解释力意味着什么?换句话说:如果一个人既丧失了正确性又缺乏预测能力,那么模型还剩下什么? 当模型具有解释力但没有预测力时,可以进行哪些经验验证?Shmueli提到了类似的事情:使用AIC进行解释,使用BIC进行预测,等等,但是我不知道这是如何解决问题的。对于预测模型,您可以使用AIC,BIC或R2R2R^2或L1L1L1正则化等,但是最终出于样本测试和生产性能的决定因素决定了模型的质量。但是对于解释得很好的模型,我看不到任何损失函数如何能够真正评估模型。在科学哲学中,存在不确定性的概念对于任何给定的数据集,总可以明智地选择某种分布(或分布的混合)和损失函数LLL,使其适合数据(因此可以声称可以解释它)。此外,对于有人声称模型足以解释数据的情况,LLL应当处于的阈值是任意的(类似p值,为什么p&lt;0.05p&lt;0.05p < 0.05而不是p&lt;0.1p&lt;0.1p < 0.1或p&lt;0.01p&lt;0.01p < 0.01?)。 基于以上所述,由于不可能进行样本外测试,因此如何客观地验证可以很好地解释但不能很好地预测的模型?

4
贝叶斯统计如何处理先验缺失?
这个问题的灵感来自于我最近的两次互动,一次是在简历中,另一次是在Economics.se。 在那里,我已经发布了一个答案,以著名的“信封悖论”(请注意,不是在 “正确答案”,而是从具体的假设,流程约情况的结构的答案)。一段时间后,一个用户发表了评论,我进行了交谈,试图了解他的观点。很明显,他在思考贝叶斯方法,并不停地谈论先验-然后我恍然大悟,我对我自己说:“等一下,谁说过任何事先什么吗?在路上,我已经制定了问题,这里没有先验条件,他们只是不需要输入图片,也不需要”。 最近,我在简历中看到了关于统计独立性的答案。我向作者评论说他的判决 “ ...如果事件在统计上是独立的,那么(根据定义)我们不能从观察另一个事件中学到任何事情。” 是公然的错误。在评论交流中,他一直回头谈(他的话) ““学习”是否意味着基于对另一个事物的观察来改变我们对事物的信念? 再一次,很明显,他正在思考贝叶斯方法,并且他认为不言而喻,我们是从某种信念(即先验)开始的,然后是我们如何更改/更新它们的问题。但是,如何建立第一至第一的信念? 由于科学必须符合现实,因此我注意到存在这样的情况,即所涉及的人类没有先例(一件事,我一直都没有任何先例地进入情况,并且请不要争辩说我确实有先例,但是我只是不了解而已,让我们在此处进行虚假的精神分析)。 因为我碰巧听到过“无信息先验”一词,所以我将问题分为两个部分,并且我可以肯定,在贝叶斯理论中精通的用户确切知道我要问的问题: 问题1:是否没有先验等价物(从严格的理论意义上讲)与没有信息的先验相提并论? 如果对Q1的回答是“是”(请作详细说明),则意味着贝叶斯方法是普遍适用的,并且从一开始就适用,因为在任何情况下,涉案人员都宣称“我没有先验”,我们可以补充一下。它所处的先验地位对于手头的案件没有多大意义。 但是,如果对Q1的回答为“否”,那么Q2就会出现: 问题2:如果问题1的答案为“否”,是否表示在没有先验条件的情况下,贝叶斯方法从一开始就不适用,我们必须首先通过某种非贝叶斯方法形成先验条件,这样我们就可以随后应用贝叶斯方法了?

2
频率统计的主观性
我经常听到有人声称贝叶斯统计数据可能是高度主观的。主要论点是推论取决于先验的选择(即使可以使用无差异或最大熵的原理来选择先验)。相比之下,常客统计通常更客观。这句话有多少道理? 另外,这让我感到奇怪: 经常性统计的具体要素(如果有)中哪些是特别主观的,在贝叶斯统计中不存在或不太重要? 贝叶斯主义的主观性是否比常客主义的统计更为普遍?

3
费舍尔这句话是什么意思?
我到处都看到这个名言,但每次都无法理解重点。 一个人暂时拒绝假设的情况,作为惯常做法,当重要性达到1%或更高水平时,肯定会被误以为不超过1%的此类决定。因为当假设正确时,他只会在这些情况的1%中被误解,而当假设错误时,他在误解中永远不会被误解。[...]但是,这种计算是荒谬的学术研究,因为实际上没有科学工作者每年都有固定的意义水平,在任何情况下,他都拒绝假设。他宁愿根据自己的证据和想法对每一个具体案件都下定决心。不应忘记,为进行测试而选择的案例显然是一个高度选择的案例,并且即使对于一个工人也无法指定选择条件;同样,在所使用的论点中选择一个特定的审判所表明的实际重要性水平显然是不合法的,就好像使用这一水平是他一生的习惯。 (统计方法和科学推断,1956年,第42-45页) 更具体地说,我不明白 为什么选择用于“高度选择”测试的案例?假设您想知道一个区域内人员的平均身高是否小于165厘米,然后决定进行测试。据我所知,标准程序是从该区域抽取随机样本并测量其高度。如何高度选择? 假设案例是经过高度选择的,但是这与重要性级别的选择有什么关系?再次考虑上面的例子,如果您的抽样方法(我认为是费舍尔所说的选择条件)是歪斜的,并且以某种方式偏爱高个子,那么整个研究就会毁了,而对显着性水平的主观确定无法挽救它。 实际上,我什至不知道什么是“特定试验所表明的实际重要性水平”。它是该实验的值,还是一些著名的预设值(如著名的0.05),还是其他?ppp

6
是否存在我们无法抽样的单变量分布?
从单变量分布(逆变换,接受拒绝,Metropolis-Hastings等)中,我们有各种各样的随机生成方法,似乎我们可以从任何有效分布中采样-是这样吗? 您能否提供无法随机生成的单变量分布示例?我想这个不可能的例子不存在(?),所以说“不可能”是指计算量非常大的情况,例如,需要蛮力模拟,例如绘制大量样本以仅接受他们很少。 如果不存在这样的示例,我们是否可以实际证明可以从任何有效分布中生成随机抽奖?我只是很好奇是否存在反例。


By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.