确定性世界中的机会运作


15

在史蒂文·平克(Steven Pinker)的书《我们的天性更好的天使》中,他指出

概率是一个透视问题。在足够近的范围内观察,个别事件具有确定的原因。甚至可以从起始条件和物理定律预测出掷硬币的情况,熟练的魔术师每次都可以利用这些定律投头。但是,当我们进行放大以对大量此类事件进行广角观察时,我们会看到大量原因的总和,这些原因有时相互抵消,有时沿同一方向排列。物理学家和哲学家亨利·庞加莱(Henri Poincare)解释说,当大量的微不足道的原因加在一起产生可怕的影响,或者当一个小的原因未能引起我们注意时,我们便会在确定性世界中看到机会的运作,而​​我们无法错过。如果是有组织的暴力,可能有人会发动战争;他等待机会的时刻,可能会或可能不会到来;他的敌人决定参与或撤退;子弹飞 炸弹爆炸;人们死了。每个事件都可以由神经科学,物理学和生理学定律确定。但是,总的来说,进入此矩阵的许多原因有时可以改组为极端组合。(第209页)

我对加粗的句子特别感兴趣,但其余内容供我参考。我的问题是:是否有统计学方法描述Poincare描述的两个过程?这是我的猜测:

1)“大量微不足道的影响加起来令人震惊。” 我听到的“大量原因”和“累加”就像中心极限定理。但是,在CLT(的经典定义)中,原因需要是随机变量,而不是确定性影响。这里的标准方法是将这些确定性效应近似为某种随机变量吗?

2)“忽略我们的一个小原因决定了我们不能错过的一个大影响。” 在我看来,您可以将其视为某种隐藏的马尔可夫模型。但是,HMM中的(不可观察到的)状态转换概率就是那个概率,根据定义,它还是不确定的。

Answers:


7

有趣的想法(+1)。

在情况1)和情况2)中,问题是相同的:我们没有完整的信息。概率是缺乏信息的一种度量。

1)细微的原因可能纯粹是确定性的,但是确定性过程无法知道哪个特定原因起作用。想想气体中的分子。力学定律适用,那么这里随机是什么?隐藏给我们的信息是:哪个分子以什么速度运动。因此,适用CLT并不是因为系统中存在随机性,而是因为我们对系统表示中存在随机性。

2)在这种情况下,HMM中不一定存在时间分量。我的解释与以前相同,系统可能是非随机的,但是我们对其状态的访问具有一定的随机性。

编辑:我不知道庞加莱是否正在考虑针对这两种情况的不同统计方法。在情况1)中,我们知道varialbes,但是我们无法测量它们,因为存在太多而又太小。在情况2)中,我们不知道变量。两种方法最终都会做出假设,并尽我们所能对可观察的事物进行建模,并且在很多情况下,我们假设情况2)中的正态性。

但是,如果有一个区别,我认为那将会出现。如果所有系统都是由微不足道的总和确定的,那么物理世界的所有随机变量都是高斯的。显然,事实并非如此。为什么?因为规模很重要。为什么?因为新属性是通过较小规模的交互作用出现的,所以这些新属性不必是高斯的。实际上,我们没有关于出现的统计理论(据我所知),但是也许有一天我们会出现。然后将有理由对情况1)和2)使用不同的统计方法


1
感谢您的回答。双方都同意我们没有完整的信息这一事实-这是构筑信息的一种好方法。但是,我希望看到一个答案,可以进一步区分这两种情况。庞加莱在想什么?
Andy McKenzie 2012年

我看到你的担心。我编辑了答案,以尽力而为。
gui11aume12年

4

我认为您对声明的阅读过多。这似乎是在这样一个前提下,即世界是确定性的,而人类则是概率地建模,因为与通过物理学的所有细节以及描述它的任何其他数学方程式相比较,更容易估算出正在发生的事情。我认为关于确定性与随机效应的争论由来已久,尤其是在物理学家和统计学家之间。以下几句话使您特别大胆地震惊了我。“甚至可以从起始条件和物理定律预测出掷硬币的情况,熟练的魔术师每次都可以利用这些定律投头。” 当我在1970年代后期在斯坦福大学读研究生时,统计学家兼魔术师Persi Diaconis和物理学家Joe Keller实际试图将物理定律应用于硬币翻转,以根据关于是否头部是否朝上且准确; y手指的弹力如何撞击硬币。我认为他们可能已经解决了。但是,即使魔术师具有经过训练的伪糖尿病的统计知识,认为魔术师也可以抛掷硬币并每次都浮出水面,这是荒谬的。我相信他们发现不可能复制初始条件,并且我认为混沌理论适用。初始状态下的小扰动会对硬币的飞行产生较大影响,并使结果不可预测。作为统计学家,我会说,即使世界是确定性的随机模型,其预测结果也比复杂的确定性法律做得更好。当物理学简单时,可以并且应该使用确定性定律。例如,牛顿的万有引力定律在确定物体撞击地面时从地面上方10英尺处掉落的速度并使用等式d = gt时效果很好。也可以解决非常精确地完成坠落所需的时间,因为重力常数g已被高精度地确定,并且该方程几乎完全适用。2


2
迈克尔Chernick,你可能有兴趣在条大约戴康尼斯。
青色

我将用“ ...人类以概率方式建模,因为它很难合并微小的细节,因此替换了” ...人类以概率方式建模,因为它更容易近似正在发生的事情...”。大多数时候都没关系,...”。此外,您正在对更多的哲学/概念性问题采取“实用”的方法。混沌理论只是“在实践中”的一个问题,因为我们没有任意准确的数字表示形式。确定性定律的另一个问题是它们经常取决于我们无法衡量的事物。
概率

1
谢谢青色。我没看过那篇特别的文章,但是我看过其他几篇关于Persi的文章,我很了解他,他是前助理教授,他在1974-1978年的20年代末和30年代初时教我概率论和时间序列。同样,Persi还让我和Michael Cohen(当时我和Michael Cohen都是研究生)在布上剃刮骰子数百次或数千次,以证实他的理论,即这种剃刮的偏见是什么。
Michael R. Chernick 2012年

1
像任何优秀的实验者一样,他没有告诉我们剃过毛,而且面积上的差别并不大,以至于无法引起人们的注意。当然,如果您想用剃光的骰子欺骗赌博场所,那么您就不能剃光太多,以使其变得引人注目,但也不会太短,以至于您要永远获得一些丰厚的奖金并避免赌徒的破产。顺带一提,我们对此实验有些怀疑,因为试图确认每一侧都非常接近时间的1/6并没有多大意义。
Michael R. Chernick 2012年

还要做一个表明您可以偏向于正面的公平硬币的经验,这远非每次都能获得正面的效果。彩票委员会使用统计学家来测试他们的机器,以确保它们是公平的。
Michael R. Chernick 2012年

4

早期版本 在第一个方程式中有不正确的项,而在第三个方程式中缺少2 N。感谢Cardianl注意到这一点2N 2N

这不是一个完整的答案,但评论太久。只给约1点一些数学直觉),我们有很大的限制如下(使用斯特灵公式,所以ñb ñ手段ñ →交通ñNanbnlimnanbn=1

(NNf)12πNf(1f)exp(NH(f))

其中是熵函数。我们还有H f )的二阶泰勒级数(大约为1的众数H(f)=flog(f)+(1f)log(1f)H(f)):12

H(f)log(2)+2(f12)2

因此,我们还有:

(NNf)2N12πNf(1f)exp(2N(NfN2)2)

这些限制的含义是,包括计算可能发生的某些可能方式(例如因果效应分析)的任何过程均会导致正态分布。这不取决于是随机的还是确定的。中心极限定理说的是,一组给定事件可能发生的大多数方式都可以通过正态分布很好地近似。f


1
谢谢。我猜想OP在将加粗的句子与CLT联系起来方面没有读太多。但是我可以确保我正确理解了吗?您是说对于大的N而言,一次使用Nf的N个事物的组合数量大约等于具有方差参数Nf(1-F)和均值参数N / 2的正常密度?而且这仅仅是一个渐近的数学性质,与概率无关吗?就像使用梅花形设计看到De Moivre-LaPlace版本的中心极限定理一样令人惊叹!
Michael R. Chernick 2012年

谢谢,非概率地考虑正态分布非常有帮助。但是,我不明白1)第一个极限是如何产生的,以及2)您在围绕Taylor级数展开什么点。
Andy McKenzie 2012年

1
你能澄清一下你的符号的手段?它不能是标准渐进符号指示一个ñ / b Ñ1。左侧很大,右侧很小!也许一旦解决了这个问题,@ Michael不会感到惊讶,因为分布的收敛(甚至是这样的局部极限定律)仅仅是关于某些单调非递减函数序列的分析性陈述,因此从本质上讲并不是与任何“概率论”联系在一起。anbnan/bn1
红衣主教

编辑看起来更好。但是,第一个显示方程式中仍然必须缺少一个术语。:)
红衣主教2012年

log(N)

0

Pinker的书中的引用和确定性世界的思想完全忽略了量子力学和不确定的海森堡原理。想象一下,将少量放射性物质放在探测器附近,并安排数量和距离,以便在预定时间间隔内有50%的机会检测到衰变。现在,将检测器连接到继电器,如果检测到衰减,继电器将起到非常重要的作用,并且仅可操作一次设备。

您现在已经创造了一种情况,即未来本质上是不可预测的。(此示例摘自1960年代中期在MIT教授大二或初中物理的任何人所描述的示例。)

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.