Wilk,MB和Gnanadesikan,R. 1968年。数据分析的概率图方法。
Biometrika 55:1-17。Jstor链接(如果可以访问)
在撰写本文时,这篇论文已有将近50年的历史,但仍然感到新鲜和创新。作者使用大量有趣且实质性的示例,结合并扩展了各种思想,以使用QQ(分位数-分位数)和PP(概率-概率)图的框架来绘制和比较分布。这里的分布广义上是指在其分析中产生的任何数据集或数字集(残差,对比度等)。
这些图的特定版本可以追溯到几十年前,最明显的是正常概率图或正常分数图。在这些术语中,这是分位数-分位数图,即从正态(高斯)分布的相同大小的样本中观察到的分位数与预期分位数或理论分位数的曲线。但是作者们谦虚而又自信地表明,同样的想法可以很容易地扩展-实际上在现代计算中可以扩展-用于检查其他种类的分位数并自动绘制结果。
当时在贝尔电话实验室工作的作者都使用了最先进的计算设备,甚至许多大学和研究机构也花了十年左右的时间来追赶。即使到现在,本文中的想法仍应得到广泛的应用。这是一种罕见的介绍性文字或课程,其中包含除常规QQ情节以外的任何这些想法。当引入分布图时,直方图和箱形图(通常非常有用,但是每个都很笨拙并且在几种方面受到限制)仍然是主要的主食。
在个人层面上,尽管本文的主要思想在我的职业生涯中是很熟悉的,但我还是喜欢每隔两年左右重新阅读一遍。一个很好的理由是,作者以严肃的例子产生简单而有力的想法,以取得良好的效果,从而感到高兴。另一个很好的理由是,简洁撰写的论文没有引起轰动的痕迹,暗示了主要思想的延伸。我已经不止一次地重新发现了在侧边提示和进一步评论中明确涵盖的主要思想的转折。
这不仅是对统计图形特别感兴趣的人的论文,尽管我认为应该包括对各种统计感兴趣的每个人。它促进了思考分布的方法,这些方法实际上有助于开发任何人的统计技能和见解。