从使用统计软件过渡到理解数学方程式?


12

内容:

我是心理学博士研究生。与许多心理学博士生一样,我知道如何使用统计软件进行各种统计分析,以及PCA,分类树和聚类分析等技术。但这并不能真正令人满意,因为尽管我可以解释为什么进行分析以及指标的含义,但无法解释该技术的工作原理。

真正的问题是,掌握统计软件很容易,但是却受到限制。要学习文章中的新技术,我需要了解如何阅读数学方程式。目前,我无法计算特征值或K均值。方程对我来说就像一门外语。

题:

  • 是否有全面的指南可帮助您理解期刊文章中的方程式?

编辑:

我认为这个问题将更加自我解释:在一定的复杂性之上,统计符号对我来说变得毫无意义。假设我想用R或C ++编写自己的函数以了解一种技术,但是有一个障碍。我无法将方程式转换为程序。确实:我不知道美国博士学位学校的情况,但是在我的(法国),我唯一可以学习的课程是大约16世纪的文学运动...


@Coronier对不起,我怀疑是否有全面的指南来理解使用统计建模的心理学文章。但是所需的背景知识应全部在统计学硕士学位的水平上。如果您的计划愿意为此付费,请考虑获取统计信息的平均水平。针对您的目的的下一个最佳选择是重新获取统计部门的多元统计信息的版本-通常它们提供具有PCA,聚类,树等数学背景的注释。您将需要线性代数和基础数学的背景统计信息。
2011年

请提出更多具体问题。

4
我也是心理学博士学位的学生,所以我选择在大学本科学习大量的数学,因为有太多的心理学博士不知道如何计算PCA(例如)。您需要做的第一件事就是通过任何体面的线性代数教科书来学习。什么是体面的线性代数教科书?吉尔伯特·斯特朗(Gilbert Strang)就是炸弹,他在麻省理工学院的网站上有线性代数课程的视频讲座可以启动。您甚至可以在iTunes上获得它们。
菲利普·

1
这个问题是如此广泛,以至于在几段中都不会得到令人满意的答案。统计信息就像问题:将其分解为几个易于管理的组件,会变得更加容易。
神父

我只能同意以上评论。您要么必须专注于特定问题,要么只需要首先阅读一些教科书或在线讲义。一本体面的教科书涵盖了多变量统计的基本概念,并附有插图,这是卡洛尔和格林所著的《应用多变量分析的数学工具》(美联社,1997年,修订版)。另一个是Tinsley和Brown撰写的Applied Multivariate Statistics and Mathematical Modeling(AP,2000)。
chl

Answers:


9

概述:

  • 我的印象是,您的经历对于许多社会科学领域的学生来说是很普遍的。
  • 起点是学习的动力。
  • 您可以选择自学正式授课路线。

正式说明:

在这方面有很多选择。您可能会考虑统计学专业的硕士,或者只是在统计学部门修几门课程。但是,您可能需要检查您是否具有必要的数学背景。根据课程的不同,您可能需要先重读微积分前的数学,然后再重新学习微积分和线性代数之类的材料,然后再处理大学级别的数学严格的统计学问题。

自学成才

或者,您可以走上自学之路。互联网上有很多好的资源。特别地,在数学教科书中阅读和练习很重要,但可能还不够。听老师讲解数学并观察他们解决问题的重要性。

考虑您的数学目标以及实现这些目标所需的数学先决条件也很重要。如果方程对您来说就像一门外语,那么您可能会发现您需要首先学习基础数学。

我准备了一些资源,旨在帮助那些正在从使用统计软件过渡到理解基础数学的人们。

  • 视频免费的在线数学视频列表 -这篇文章还提供了一些指导,说明从预演算到微积分,线性代数,概率和数学统计的合适的数学序列。另请参阅数学统计视频上的这个问题。
  • 阅读和发音 -首要挑战之一是学习如何发音和阅读数学方程式。我写了两篇文章,一篇关于发音,另一篇关于非数学家阅读数学的技巧
  • 写作 -学习写数学可以帮助阅读数学。尝试学习LaTeX,并查看有关LaTeX的一些数学指南
  • 书籍:关于数学学习,我认为值得投资一些优秀的教科书。但是,这些天有很多免费的在线选项

谢谢,您提供的资源很棒。顺便说一句,您的博客完全吸引人(我是I / OP学生和useR,对我来说就像一个启示)。
科罗尼尔2011年

@Coronier很高兴认识另一个将R与I / O Psych相结合的人。
Jeromy Anglim 2011年

3

我的印象是,您认为可以通过将其编程为R或C ++来了解统计方程。你不能。要理解统计方程式,请在包含方程式的每一章结尾处找到一本带有很多作业问题的“本科”教科书,然后在包含方程式的本章末尾进行作业。

例如,要了解PCA,您需要对线性代数,尤其是奇异值分解有一个很好的了解。通过迈克尔·尼尔森(Michael Nielsen)的书学习量子计算时,对我来说很明显,我需要复习线性代数。我看过吉尔伯特·斯特朗(Gilbert Strang)的视频,它们对建立基本的概念理解非常有帮助。但是,直到我找到一本包含很多家庭作业问题的线性代数书,然后才需要做这些工作,材料的细微差别才得以解决。


4
@ schenectady在我同情您的观点的同时,至少对我而言,R代码提供了一个桥梁,我可以使用它来加深对相关方程式和数学的理解。话虽如此,我全心全意地同意对问题,统计学和数学的需求,这只能通过实践来学习。
richiemorrisroe 2011年

2

我理解您的困难,因为当我尝试做一些统计方面的新问题时,我遇到了类似的问题(我也是研究生,但是在不同的领域)。我发现检查R代码对于了解计算方式非常有用。例如,我最近一直在学习如何使用kmeans集群,并且在概念和实现方面有许多基本问题。使用一个R安装(我建议R Studiohttp://www.rstudio.org/,但是任何安装工程),只需键入kmeans的命令行。这是部分输出的示例:

x <- as.matrix(x)
    m <- nrow(x)
    if (missing(centers)) 
        stop("'centers' must be a number or a matrix")
    nmeth <- switch(match.arg(algorithm), `Hartigan-Wong` = 1, 
        Lloyd = 2, Forgy = 2, MacQueen = 3)
    if (length(centers) == 1L) {
        if (centers == 1) 
            nmeth <- 3
        k <- centers
        if (nstart == 1) 
            centers <- x[sample.int(m, k), , drop = FALSE]
        if (nstart >= 2 || any(duplicated(centers))) {
            cn <- unique(x)
            mm <- nrow(cn)
            if (mm < k) 
                stop("more cluster centers than distinct data points.")
            centers <- cn[sample.int(mm, k), , drop = FALSE]
        }
    } 

我不确定每次检查源代码的实用性,但是如果您对语法有一定的了解,它确实可以帮助我了解发生了什么。

我在stackoverflow上问过的上一个问题向我指出了这个方向,但也有帮助地告诉我有关代码的注释有时包含在此处


更一般而言,《统计软件杂志》说明了理论与实现之间的这种联系,但是它经常涉及高级主题(我个人很难理解),但可以作为示例。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.