与其他答案相反,我认为只要有可用数据,您就可以说一些关于Bolts功能的事情。首先,让我们缩小您的问题。您询问的是最快的人类,但是由于男女的跑步速度分布存在差异,因此,最好的女子赛跑者的女人似乎慢于最好的男子赛跑者,因此我们应该关注男子。为了获得一些数据,我们可以查看过去45年中100次运行的最佳年度表现。关于此数据,有几件事需要注意:
- 那是最好的跑步时间,因此它们并没有告诉我们所有人类的能力,而是告诉我们所达到的最低速度。
- 我们假设此数据反映了世界上最佳跑步者的样本。尽管可能有更好的跑步者没有参加锦标赛,但这种假设似乎是相当合理的。
首先,让我们讨论如何不分析这些数据。您可能会注意到,如果将运行时间与时间作图,则会观察到很强的线性关系。
这可能会导致您使用线性回归来预测我们未来几年可以观察到的更好的跑步者。但是,这将是一个非常糟糕的主意,这将不可避免地导致您得出结论,在大约两千年的时间内,人类将能够在零秒内跑完100米,然后他们将开始达到负跑时!这显然是荒谬的,因为我们可以想象我们的能力存在某种生物学和物理上的限制,这是我们所不知道的。
X 1,X 2,… ,X n Y i Z 1,Z 2,… ,Z k − Z iY=max(X1,X2,…,Xn)X1,X2,…,XnYiZ1,Z2,…,Zk−Zi遵循GEV分配的最小值。因此,我们可以将GEV分布拟合到行驶速度数据,这导致非常合适的拟合(请参见下文)。
如果查看模型建议的累积分布,您会注意到Usain Bolt的最佳运行时间在最低1%分布的尾巴。因此,如果我们坚持使用这些数据以及这个玩具示例分析,我们将得出结论,运行时间短得多的可能性不大(但显然有可能)。此分析的明显问题是忽略了我们看到最佳运行时间逐年改进的事实。这使我们回到答案第一部分中描述的问题,即假设此处的回归模型存在风险。可以改进的另一件事是,我们可以使用贝叶斯方法并假设信息量优先,这可以解释一些可能尚未观察到的关于生理上可能的运行时间的数据外知识(但据我所知,目前尚不清楚)。最后,类似的极值理论已经在体育研究中使用,例如Einmahl和Magnus(2008)在体育研究中通过极值理论在田径运动中的记录。
您可能会抗议,您不是在询问更快的跑步时间的概率,而是在询问观察更快的跑步者的概率。不幸的是,在这里我们不能做很多事情,因为我们不知道跑步者成为职业运动员的可能性和所记录的跑步时间对他而言是多少。这并不是随机发生的,有许多因素导致一些运动员成为职业运动员而另一些则不是(甚至有人喜欢跑步,甚至完全喜欢跑步)。为此,我们将必须有一份有关跑步者的详细人口数据,此外,由于您要询问分布的极端情况,因此数据必须非常大。因此,我同意其他答案。