我认为我将不能给固定时间的投资以继续学习数据分析
我认为Casella&Berger并不是一个以数据分析方式学习数据的地方。这里是学习一些统计理论工具的地方。
到目前为止,我的经验告诉我要成为一名统计学家,需要进行大量繁琐的计算,涉及各种分布(Weibull,Cauchy,t,F ...)。
作为统计员,我已经花费了很多时间来进行数据分析。它很少(几乎从来没有)涉及到我进行乏味的计算。它有时涉及一些简单的代数,但是通常可以解决常见的问题,并且我不需要在每次复制上花费任何精力。
计算机进行所有繁琐的计算。
如果我不准备承担一个合理的标准案例(例如,不准备使用GLM),那么我通常也没有足够的信息来承担任何其他分布,因此计算中的问题LRT通常没有实际意义(我可以在需要时执行它们,它们要么已经被解决,要么很少出现,这是一个有趣的转移)。
我倾向于做很多模拟。我还经常尝试以某种形式在参数假设的旁边或代替参数假设使用重采样。
我是否需要像以前一样每周花费20个小时以上?
这取决于您想做什么,以及要多长时间才能做好。
数据分析是一种技能,需要实践和大量的知识基础。您已经掌握了一些所需的知识。
如果您想在各种各样的事情上成为一名优秀的从业者,这将需要很多时间-但在我看来,这比代数有趣得多,比如做Casella和Berger练习。
我建立的一些技能说回归问题对时间序列很有帮助,但是需要很多新技能。因此,学习解释残差图和QQ图很方便,但是它们并没有告诉我我需要担心多少,而不必担心PACF图中的小变化,也不会像使用一步一步预测那样为我提供工具错误。
因此,例如,我不需要花费精力去研究如何对典型的γ或weibull模型进行合理的ML ,因为它们已经足够解决了已经被方便地解决的问题的标准。
如果您要进行研究,则需要在诸如Casella&Berger这样的地方掌握的更多技能(但是即使具备这些技能,您也应该阅读多于一本书)。
一些建议的事情:
即使您什么也不做,您绝对应该建立一些回归技能。
有很多相当不错的书,但也许Draper&Smith 应用回归分析以及Fox和Weisberg An R的应用回归同伴;我还建议您考虑遵循Harrell的回归建模策略
(您可以用任意数量的好书代替Draper和Smith,找到一两本适合您的书。)
第二本书有许多在线附加章节,非常值得一读(以及它自己的R包)
-
第二个不错的选择是Venables&Ripley的S的《现代应用统计》。
这是相当广泛的想法的基础。
事实证明,您需要某些主题的一些基础材料(我不知道您的背景)。
然后,您需要开始考虑想要/需要统计的哪些领域-贝叶斯统计,时间序列,多元分析等