我认为我无法定期投入时间继续学习数据分析
我不认为 Casella & Berger 是一个以数据分析的方式学习数据的地方。这是一个学习一些统计理论工具的地方。
到目前为止,我的经验告诉我要成为一名统计学家,需要承受大量繁琐的计算,涉及各种分布(Weibull、Cauchy、t、F...)。
作为一名统计学家,我花了很多时间进行数据分析。它很少(几乎从不)涉及我进行繁琐的计算。它有时涉及一些简单的代数,但通常会解决常见问题,我不需要每次都花费任何精力来复制它。
计算机完成所有繁琐的计算。
如果我不准备假设一个合理的标准情况(例如不准备使用 GLM),我通常也没有足够的信息来假设任何其他分布,所以计算的问题LRT 通常是没有实际意义的(我可以在需要时执行它们,它们要么往往已经解决,要么很少出现,以至于这是一个有趣的转移)。
我倾向于做很多模拟;我也经常尝试在参数假设旁边或代替参数假设使用某种形式的重采样。
我需要像以前一样每周花 20 小时以上的时间在上面吗?
这取决于您希望能够做什么,以及您想在多长时间内擅长它。
数据分析是一种技能,它需要实践和大量的知识基础。你已经掌握了一些你需要的知识。
如果你想在各种各样的事情上成为一名优秀的练习者,这将需要很多时间——但在我看来,这比代数和卡塞拉和伯杰练习更有趣。
我建立的一些技能说回归问题对时间序列很有帮助,比如说——但需要很多新技能。因此,学习解释残差图和 QQ 图很方便,但它们并没有告诉我我有多少需要担心 PACF 图中的小颠簸,也没有给我使用一步超前预测之类的工具错误。
因此,例如,我不需要花费精力来弄清楚如何为典型的gamma 或 weibull 模型进行合理的 ML ,因为它们足够标准,可以解决已经在很大程度上以方便形式出现的问题。
如果你来做研究,你将需要更多在 Casella & Berger 这样的地方学到的技能(但即使有这些技能,你也应该阅读不止一本书)。
一些建议的事情:
你绝对应该建立一些回归技能,即使你什么都不做。
有很多很好的书,但也许是 Draper & Smith Applied Regression Analysis加上 Fox 和 Weisberg An R Companion to Applied Regression;我还建议您考虑遵循 Harrell 的回归建模策略
(你可以用任意数量的好书代替德雷珀和史密斯——找到一两本适合你的书。)
第二本书有许多非常值得阅读的在线附加章节(以及它自己的R-package)
--
一个很好的第二个服务将是 Venables & Ripley 的现代应用统计与 S。
这是相当广泛的想法的一些基础。
在某些主题中,您可能需要一些更基本的材料(我不知道您的背景)。
然后你需要开始考虑你想要/需要哪些统计领域——贝叶斯统计、时间序列、多变量分析等