简而言之:探索性数据分析的贝叶斯和频率论方法有什么区别吗?
我不知道EDA方法中的固有偏差,因为直方图是直方图,散点图是散点图等,我也没有找到关于EDA的讲授或呈现方式差异的示例(忽略了A. Gelman的特别理论论文) 。最后,我看了CRAN,它是所有应用的仲裁者:我没有找到适合贝叶斯方法的软件包。但是,我认为CV可能会有一些人对此有所了解。
为什么要有差异?
对于初学者:
- 在确定适当的先验分布时,不应该用肉眼进行调查吗?
- 在汇总数据并建议是使用常客模型还是贝叶斯模型时,EDA是否不建议选择哪个方向?
- 两种方法在如何处理混合模型方面有非常明显的区别。鉴定样本可能来自人群混合是具有挑战性的,并且与用于估计混合物参数的方法直接相关。
- 两种方法都包含随机模型,并且通过了解数据来驱动模型的选择。更复杂的数据或更复杂的模型需要在EDA中花费更多时间。鉴于随机模型或生成过程之间的这种区别,EDA活动存在差异,因此,难道不应该因不同的随机方法而产生区别吗?
注1:我并不关心“阵营”的哲学-我只想解决我的EDA工具包和方法中的任何空白。