拉里·瓦瑟曼(Larry Wasserman)的《所有统计》是一本不错的书,可以带动一下数学统计。这是我自己使用的第一本关于数学统计的书。它包括诸如假设检验和最大似然估计之类的经典著作,但它也涵盖了许多新近开发但同样重要的主题,例如自举。Wasserman总是在统计方面占一席之地,而在机器学习方面则占一席之地,我认为所有当代数据分析师都应该这样做。如果您只熟悉这两个领域中的一个领域,那么您将丢失很多。此外,这本书还有很多很好的练习。
如果您有实际分析的背景,并且想要原始的,未切割的东西(我指的是对概率和统计学的量度理论处理),请尝试Mark J. Schervish的统计学理论。Schervish是DeGroot和Schervish的一半,后者的技术性较差的书《概率与统计》可能是当今最受欢迎的数学统计书。《统计理论》是一本非常有用的活泼书籍,它通常只适合应该自己完成所有工作的研究生使用。老实说,我觉得这本书很难(尽管不如邵俊的《数学统计》那么难)),并最终感觉到要掌握它需要付出巨大的努力,这并不能很好地利用我作为应用数据分析师的时间。但是我仍然学到了很多东西,并且对什么是测度理论以及如何用它来解决在较幼稚的传统概率论方法中出现的毛茸茸的理论难题有了很好的理解。我也开始更好地理解可交换性和独立性的异同。