我即将获得应用数学学士学位,今年秋天我将攻读统计学硕士学位。
应用统计学有许多专业领域。我意识到我可能对成为数据分析师更感兴趣,在市场研究或 IT 中使用大数据,但我不确定需要什么样的技能以及成为数据分析师应该参加哪些核心课程。
我学过一些 MatLab、R、SPSS、C、ruby,不能说我是这些方面的专家。我正在学习 SAS,因为 SAS 似乎是每个统计大师都应该知道的。(这是真的吗?)
我现在有点困惑,需要一些关于我应该集中学习哪些技能以及应该参加哪些课程的具体建议。
TIA。
我即将获得应用数学学士学位,今年秋天我将攻读统计学硕士学位。
应用统计学有许多专业领域。我意识到我可能对成为数据分析师更感兴趣,在市场研究或 IT 中使用大数据,但我不确定需要什么样的技能以及成为数据分析师应该参加哪些核心课程。
我学过一些 MatLab、R、SPSS、C、ruby,不能说我是这些方面的专家。我正在学习 SAS,因为 SAS 似乎是每个统计大师都应该知道的。(这是真的吗?)
我现在有点困惑,需要一些关于我应该集中学习哪些技能以及应该参加哪些课程的具体建议。
TIA。
除了 R 或 SAS 等技术技能外,SQL 和其他一些更高级别的技能也很重要,包括:
数据处理:为了能够分析数据,您经常需要花费大量时间来获取数据并将其处理成可以分析的形式。许多统计学家会告诉你,他们在给定项目上的大部分时间都花在处理数据上——所以擅长这一点很重要!
理解:许多人大大低估了理解复杂数据集所需的时间。在过去的日子里,人们不得不花时间向一位工匠大师当学徒,使用数据集,您必须花时间查看数据的各个方面,了解它的维度和缺失的数据,并与人们交谈以试图理解数据。同样,您将花费大量时间来做这件事,这需要练习来建立这项技能!
可视化:与上述齐头并进的是可视化。知道如何绘制数据以帮助获得理解很重要。稍后,当您想向其他人展示您在数据集中找到的内容时,一张精心制作的图片会说出一千个单词。
需求:最难学习的一项是需求收集。您的客户通常不会清楚他们自己的想法,甚至更不清楚他们对您说的话。
SAS 在制药行业很重要,但在其他学科中则不一定。在商业和市场营销中,时间序列分析和抽样调查尤为重要。是的,大型制药公司和企业经常使用 SAS,但它价格昂贵,并且对于您在大公司中可以找到的多个用户来说更经济。在社会科学中,SPSS 更常用,但也很昂贵。R 是免费的,许多高级统计程序可以在 CRAN 库中找到。
我建议你参加一些微观计量经济学课程。业务分析师花费大量时间修补分析,一旦您完成了这些分析就没有多大意义。一个常见的例子是运行收入或利润对价格的回归,并相信这些估计某种需求弹性。很多媒体混合建模都属于这一点。理解内生性和反事实在商业世界中大有帮助。
我还要确保我知道如何清理数据,因为您的大部分时间都将花在这样做上。这涵盖了诸如 SQL 之类的硬技能,也许还有一些 Hadoop/Pig/Hive,而且还能够进行快速的直觉检查。我把这些软技能称为数字感。这些东西很少在硕士课程中教授,你看到的数据是用丝带和蝴蝶结打包的。
除了许多很棒的建议之外,我还要补充一点,您应该尝试学习一些软/人/分析技能,也许至少要学习一些您可能想要应用技能的领域。
在现实世界中,没有人会为您提供一组干净的、有据可查的数据以及要回答的精确问题。您将需要处理数据、理解数据、从人们那里汲取专业知识、了解数据所有者的业务、乞求数据、展示中期结果等。您可能经常会使用令人尴尬的简单技术。(我希望你不要期望标记数据。)
不要忽视统计数据和复杂的技术。但是不要认为你会花费大量的工作时间来做和思考它们。