贝叶斯和常识性EDA方法是否存在差异?


14

简而言之:探索性数据分析的贝叶斯和频率论方法有什么区别吗?

我不知道EDA方法中的固有偏差,因为直方图是直方图,散点图是散点图等,我也没有找到关于EDA的讲授或呈现方式差异的示例(忽略了A. Gelman的特别理论论文) 。最后,我看了CRAN,它是所有应用的仲裁者:我没有找到适合贝叶斯方法的软件包。但是,我认为CV可能会有一些人对此有所了解。

为什么要有差异?

对于初学者:

  1. 在确定适当的先验分布时,不应该用肉眼进行调查吗?
  2. 在汇总数据并建议是使用常客模型还是贝叶斯模型时,EDA是否不建议选择哪个方向?
  3. 两种方法在如何处理混合模型方面有非常明显的区别。鉴定样本可能来自人群混合是具有挑战性的,并且与用于估计混合物参数的方法直接相关。
  4. 两种方法都包含随机模型,并且通过了解数据来驱动模型的选择。更复杂的数据或更复杂的模型需要在EDA中花费更多时间。鉴于随机模型或生成过程之间的这种区别,EDA活动存在差异,因此,难道不应该因不同的随机方法而产生区别吗?

注1:我并不关心“阵营”的哲学-我只想解决我的EDA工具包和方法中的任何空白。

Answers:


17

在我看来,贝叶斯vs频率论者是关于形式推论的,探索性数据分析都不是。

当然,当涉及模型评估/拟合优度和敏感性分析时,我将对您的观点(1),(3)和(4)进行分类,但是在进行上会有所不同,但是这是因为分析和计算方法之间差异的本质,而不是哲学上的差异。

关于您的(2),我一般不会认为EDA的结果将您引向贝叶斯方法或惯常方法,但我认为最重要的是研究的目标。

对我个人而言,EDA(再加上深入的内省)将为我提供一个模型,如果我能找到一种自然的频率论方法可以很好地回答科学问题,那么我会这样做,但如果根据情况的性质,没有一种常用的方法会很好地工作,并且如果有合理的先验条件,我会使用贝叶斯。


(+1)说得很好-特别是,“ EDA(加上深入的内省)将使我指向一个模型”
suncoolsu 2011年

+1。EDA实际上不是要选择一个视角,而是要了解您的数据以做出更明智的决策。
Fomite 2011年

+1为一个好答案。不幸的是,我认为最初的问题被误解了。我并不是在问要使用EDA在贝叶斯模型还是常客模型之间做出决定。如果似乎有些人有相同的误解,我将需要回顾一下我的措辞。
Iterator

@Iterator我理解您的主要问题是:贝叶斯和常客的EDA方法之间是否存在差异?我对此的回答是:不。EDA既不是常客,也不是贝叶斯。
卡尔

3
我认为“探索性数据分析”的定义比您的定义更狭窄。我认为,所有好的数据分析都涉及探索。“探索性数据分析”与众不同之处在于缺乏模型或对形式推论的任何努力。
卡尔

0

我认为,EDA可以帮助您建立模型,做出一些假设并(如果需要)更新模型及其假设。我选择一种务实的方法来进行模型拟合和评估。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.