Answers:
探索性数据分析(EDA)的整个领域,以及约翰W.图基(John W. Tukey )撰写的关于探索性数据分析的出色著作。
我喜欢您使用图形-根据您的数据,还有许多其他图形可能有用-多少个变量?变量的性质是什么(分类?数字?连续?计数?序数?)
散点图矩阵通常是一个对具有多个变量的数据有用的图形。
您可以查找各种类型的异常值,这些异常值通常很有趣。
但是我不认为可以使整个过程真正做到有条理和科学的-探索是可以引入有条理和科学的方法之前的探索。在这里,我认为关键是玩味。
如果您具有时间顺序数据(例如时间序列数据),则存在“已知”,而等待发现的是“未知”。例如,如果您有一个10个周期的数据点序列,例如1,9,1,9,1,5,1,9,1,9,则根据此样本,您可以合理地预期1,9,1,9 ,...在未来出现。数据分析揭示的是,即使它处于+ -3 sigma限度以内,也表明DGF没有成立,但在第6阶段仍存在“异常”读数。揭露Inlier / Outlier可以使我们揭示有关数据的信息。我们还注意到,平均值不是预期值。这个想法很容易扩展到检测在分析数据之前(假设生成)可能不知道的均值漂移和/或本地时间趋势。现在很有可能接下来的10个读数也是1,9,1,9,1,5,1,9,1,9暗示“ 5”并不一定令人讨厌。如果我们从一个合适的模型中观察到一个误差过程,该过程表现出可证明的非恒定方差,那么我们可能会发现以下一种自然状态:1)参数可能在特定的时间点已经改变;2.可能需要加权分析(GLS);3.可能需要通过幂变换来变换数据;4.可能需要实际模拟误差的方差。如果您每天都有数据,那么良好的分析可能会发现,每个假期周围都有一个反映出一致/可预测行为的响应窗口(超前,同期和滞后结构)。您也许还可以揭示该月的某些日子会产生重大影响,或者星期一假期之前的星期五会有异常活动。9暗示“ 5”并不一定令人讨厌。如果我们从一个合适的模型中观察到一个误差过程,该过程表现出可证明的非恒定方差,那么我们可能会发现以下一种自然状态:1)参数可能在特定的时间点已经改变;2.可能需要加权分析(GLS);3.可能需要通过幂变换来变换数据;4.可能需要实际模拟误差的方差。如果您每天都有数据,那么良好的分析可能会发现,每个假期周围都有一个反映出一致/可预测行为的响应窗口(超前,同期和滞后结构)。您也许还可以揭示该月的某些日子会产生重大影响,或者星期一假期之前的星期五会有异常活动。9暗示“ 5”并不一定令人讨厌。如果我们从一个合适的模型中观察到一个误差过程,该过程表现出可证明的非恒定方差,那么我们可能会发现以下一种自然状态:1)参数可能在特定的时间点已经改变;2.可能需要加权分析(GLS);3.可能需要通过幂变换来变换数据;4.可能需要实际模拟误差的方差。如果您每天都有数据,那么良好的分析可能会发现,每个假期周围都有一个反映出一致/可预测行为的响应窗口(超前,同期和滞后结构)。您也许还可以揭示该月的某些日子会产生重大影响,或者星期一假期之前的星期五会有异常活动。不一定是不幸的。如果我们从一个合适的模型中观察到一个误差过程,该过程表现出可证明的非恒定方差,那么我们可能会发现以下一种自然状态:1)参数可能在特定的时间点已经改变;2.可能需要加权分析(GLS);3.可能需要通过幂变换来变换数据;4.可能需要实际模拟误差的方差。如果您每天都有数据,那么良好的分析可能会发现,每个假期周围都有一个反映出一致/可预测行为的响应窗口(超前,同期和滞后结构)。您也许还可以揭示该月的某些日子会产生重大影响,或者星期一假期之前的星期五会有异常活动。不一定是不幸的。如果我们从一个合适的模型中观察到一个误差过程,该过程显示出可证明的非恒定方差,那么我们可能会发现以下一种自然状态:1)参数可能在特定的时间点已经改变;2.可能需要加权分析(GLS);3.可能需要通过幂变换来变换数据;4.可能需要实际模拟误差的方差。如果您每天都有数据,那么良好的分析可能会发现,每个假期周围都有一个反映出一致/可预测行为的响应窗口(超前,同期和滞后结构)。您也许还可以揭示该月的某些日子会产生重大影响,或者星期一假期之前的星期五会有异常活动。如果我们从一个合适的模型中观察到一个误差过程,该过程显示出可证明的非恒定方差,那么我们可能会发现以下一种自然状态:1)参数可能在特定的时间点已经改变;2.可能需要加权分析(GLS);3.可能需要通过幂变换来变换数据;4.可能需要实际模拟误差的方差。如果您每天都有数据,那么良好的分析可能会发现,每个假期周围都有一个反映出一致/可预测行为的响应窗口(超前,同期和滞后结构)。您也许还可以揭示该月的某些日子会产生重大影响,或者星期一假期之前的星期五会有异常活动。如果我们从一个合适的模型中观察到一个误差过程,该过程显示出可证明的非恒定方差,那么我们可能会发现以下一种自然状态:1)参数可能在特定的时间点已经改变;2.可能需要加权分析(GLS);3.可能需要通过幂变换来变换数据;4.可能需要实际模拟误差的方差。如果您每天都有数据,那么良好的分析可能会发现,每个假期周围都有一个反映出一致/可预测行为的响应窗口(超前,同期和滞后结构)。您也许还可以揭示该月的某些日子会产生重大影响,或者星期一假期之前的星期五会有异常活动。可能需要加权分析(GLS);3.可能需要通过幂变换来变换数据;4.可能需要实际模拟误差的方差。如果您每天都有数据,那么良好的分析可能会发现,每个假期周围都有一个反映出一致/可预测行为的响应窗口(超前,同期和滞后结构)。您也许还可以揭示该月的某些日子会产生重大影响,或者星期一假期之前的星期五会有异常活动。可能需要加权分析(GLS);3.可能需要通过幂变换来变换数据;4.可能需要实际模拟误差的方差。如果您每天都有数据,那么良好的分析可能会发现,每个假期周围都有一个反映出一致/可预测行为的响应窗口(超前,同期和滞后结构)。您也许还可以揭示该月的某些日子会产生重大影响,或者星期一假期之前的星期五会有异常活动。每个假期周围的同期和滞后结构),以反映一致/可预测的行为。您也许还可以揭示该月的某些日子会产生重大影响,或者星期一假期之前的星期五会有异常活动。每个假期周围的同期和滞后结构),以反映一致/可预测的行为。您也许还可以揭示该月的某些日子会产生重大影响,或者星期一假期之前的星期五会有异常活动。