首先,它只是一个玩笑而已,是不正确的。Google有很多非常有才华的统计学家,信息检索专家,语言学家,经济学家,一些心理学家等等。这些人花费大量时间来教育许多非统计学家,以了解相关性和因果关系之间的差异。鉴于这是一个大型组织,可能会有很多人无知,甚至有很多人无知,但断言绝对是错误的。此外,很多教育都面向客户,尤其是广告客户。
更深入的回答:差异非常重要。仅查看搜索结果的排名,就可以让我扩展到不仅仅是“相关性”,还包括相似性,评分功能等度量。某些页面被认为是某些查询的良好结果。这些具有多种预测器功能,这些功能对于其排名很重要。与这些对查询有好的结果的好页面相反,一组网页是对相同查询有非常差的结果的页面。但是,这些页面的创建者花了很多精力使它们从数字的角度看起来像好的页面。,例如文字比对,网际网路连结等等。但是,仅因为这些页面在数值上与好页面“相似”并不意味着它们实际上是好页面。因此,谷歌已经投资并将继续投入大量精力来确定哪些合理的功能可以区分(分开)好页面和坏页面。
这还不完全是相关性和因果关系,但要深得多。某些查询的好页可能会映射到一个数值空间,在这些数值空间中它们看起来相似且与许多不相关或不良的页不同,但是仅由于结果位于要素空间的同一区域中并不意味着它们来自相同的“高质量”子集在网络上。
更简单的答案:一个非常简单的观点是解决结果的排名。最好的结果应该是第一,但是仅仅因为某事物排名第一并不意味着它是最好的结果。通过某些评分指标,您可能会发现Google的排名与质量评估的黄金标准相关联,但这并不意味着它们的排名暗示着结果在质量和相关性方面确实是按此顺序排列的。
更新(第三个答案):随着时间的流逝,还有另一个方面会影响我们所有人:这是Google排名最高的结果,可以认为是权威的,因为它是Google排名最高的结果。尽管链接分析(例如“ PageRank”(链接分析的一种方法))是一种反映感知权威性的尝试,但随着时间的流逝,主题上的新页面可能会通过链接到Google上的最高结果而简单地增强链接结构。相对于第一个结果,较权威的较新页面的开头部分存在问题。至于谷歌希望提供最相关的网页目前,有多种因素,其中包括所谓的“富得-富”的现象,出现由于相关的上认识到的因果一个隐含的效果。
更新(第四个答案):我意识到(下面的评论)阅读柏拉图的《洞穴寓言》可能对了解如何解释现实的“反射/投射”以及相关性和因果关系以及如何使之有意义。我们(或我们的机器)感知到它。严格限制在Pearson的相关性中的相关性过于有限,不能解释误解性关联(比相关性更广泛)和因果关系。