自学VS教学教育?

机器算法验证 自习 参考 教学
2022-01-18 07:33:55

对于programmers.SE ,有一个类似意图的问题。这个问题有一些很好的答案,但总的主题似乎是,没有自学,你一事无成。

显然,编程和统计之间存在一些主要区别——通过编程,你实际上只是学习了一些基本逻辑,然后反复应用它。新语言都使用相同的基本概念。自学可以让你学习更高级的概念,变得更有效率。这种东西很难教。

统计数据完全不同。应用所涉及的逻辑很容易 - 因为其他人通常已经制定了方法。事实上,这种方法通常是大学教授的大部分内容。但统计学远不止于此,而且涉及到一些非常高级的概念。如果你所学的只是应用统计学,甚至很难找到这些概念,更不用说理解它们了(尽管我想知道这可能是由于该领域的行话造成的)。此外,我发现编程中的自学需要阅读大量短文/博客来向自己介绍新概念,而有关统计数据的可访问文章几乎总是针对初学者,因此对于进阶新手来说有点无用,例如我。

所以问题是:对于统计学来说,自学比大学教育更合适还是更不合适?有哪些有效的自学方法?任何以前对人们有用的例子都将受到欢迎。

(这可能应该是一个社区 wiki,但我没有看到复选框)

4个回答

我想我在一个相当相似的地方,但我会采取行动。我最初是一名社会学研究生,一旦我完成了我所在系提供的所有统计课程,我就进入了我所在大学统计系的一些研究生课程。这是一个启示;统计学教授处理问题的方式与我的社会学教授完全不同——比我以前学到的更直观和鼓舞人心,更不公式化,而且依赖于很多我没有学过或没有学过的东西t设法在我的基础课程中学习。为了跟上进度,我不得不重新自学很多东西,但我仍然担心我还没有真正掌握这些基本概念。

在其间的四五年里,我花了很多时间广泛阅读——博客、这个网站和一些出色的教科书真的很有帮助。但这种自学是有局限性的,最大的不是我没有在学校听过一些讲座,而是我已经有四五年没有和比我更了解的人密切合作了做过。这个网站是我驳斥我错误观念的主要来源。这让我害怕,以至于我计划在今年秋天申请生物统计学的 MS 课程——当然,要参加一些有趣的课程,但也因为我只是希望有人粗暴对待我的想法并找出我的想法真的学到了。

相比之下,我在大致相同的时期和相同的条件下一直在自学 R。直到大约一年半前我帮助创建了一个 R 用户组,我还没有真正有人指出我的代码中明显愚蠢的结构。但我对我的代码几乎没有同样的焦虑,这在很大程度上是因为编程最终归结为一个问题是否有效。我并不是要减少那里的挑战——我在 StackOverflow 上工作的时间已经足够长了,我知道,对于真正的软件开发人员来说,有大量的专业知识可以用来制作优雅、高性能、可维护、适应性强和简单的东西- 使用。但是软件最终是根据其功能的执行情况来判断的。正如你所说,统计几乎有相反的问题——现代统计软件使得制作复杂模型变得相对容易,但在许多情况下,我们没有合适的系统来确保这些模型值得一试。重新创建许多已发表的分析是很困难的,而且从头开始复制以前发表的研究并不像发现新发现那样迷人(使用你认为合适的吓人语录)。我几乎总是知道我的程序什么时候是垃圾,但我从不完全确定我的模型是好的。t 和发现新发现一样迷人(使用你认为合适的吓人语录)。我几乎总是知道我的程序什么时候是垃圾,但我从不完全确定我的模型是好的。t 和发现新发现一样迷人(使用你认为合适的吓人语录)。我几乎总是知道我的程序什么时候是垃圾,但我从不完全确定我的模型是好的。

所以......就像在编程中一样,我认为自学是必不可少的。但我也认为,有一位导师或同行与你一起讨论想法,让你接触新思维,并在必要时发挥你的作用,这一点至关重要。正规教育是结识这样的人的一种方式。它是否有效取决于您的情况......

+1 提出了一个很好的问题。我认为从长远来看,你总是不得不以一种或另一种形式依赖自学。如果您对基础知识感到不舒服,那么正式课程会很棒。例如,如果您在应用统计方面感觉扎实,但觉得自己对基础数学没有了解,那么参加数理统计课程将是您的最佳选择。不过,即使在那里,研究生院最终还是要学习自己在这个领域中导航。

我想借此机会为CV唱赞歌。老实说,我认为该网站将解决您的担忧。确实有很多资源没有针对适当的水平(太高或太低),而且很难找到你需要的东西。我的猜测是书籍通常会处于最适合您的水平。它们将更加全面,对于任何主题,都会有从几乎没有任何数学知识到纯理论论文的主题,其间有许多层次。你可以在下面搜索简历如果您没有发现任何完全正确的内容,请提出一个新问题。一般来说,如果您不确定某些特定概念,只需询问即可。即使只是在网站上阅读并点击链接也能提供令人难以置信的信息——我很惊讶自从我在网站上活跃以来我学到了很多东西。

在帮助自学的具体策略方面,有两件事对我帮助最大。首先,应用统计,这真的和编程一样,或者去卡内基音乐厅,练习. 尝试找到数据集(如果可能,在现实世界中)并探索它们;查看数据,考虑可能发生的情况,拟合一些模型并检查它们是否合理,等等。你做的越多,你就会越好。为了理解各种技术背后的理论概念,模拟对我有用。当我读到某件事时,它说它以特定方式工作或在某种条件下会发生故障,我经常编写一些代码来创建这些条件并从该过程生成数据,然后拟合模型并存储任何相关指标,将其嵌套在一个循环中,然后使用它。这真的是我如何理解几乎任何事情的方式。我可以读到一些东西,而且可以非常清楚——我什至可以转身解释它——但我真的不知道得到它,直到我可以生成它并看到它的实际效果。

统计学的理论基础太深了,不能仅仅通过解决碰巧落在你办公桌上的问题来很好地理解这个主题。我见过的一些最大的统计失误来自具有编程或数学背景的人,他们兴高采烈地认为知道如何编码或计算概率与了解统计数据是一样的。

尽管如此,一个经过深思熟虑的自学计划没有理由不能胜任这项工作。至少对某些人来说确实如此:请参阅皇家统计学会的研究生文凭不乏可供阅读的教科书(由 Cox、Berger、Tukey、Nelder 和 Efron 等人编写!),优秀的免费软件 (R) 可供尝试,当然还有交叉验证以解决疑问。

对于编程,我同意自学是要走的路。作为一名统计学家,我在几个月的时间里自学了 R。然后我参加了 Coursera 的 R 编程课程,看看我是否能学到任何新东西,由于我有扎实的背景,我取得了优异的成绩,并被邀请担任该课程的助教。

至于自学统计数据,这取决于,但为了谨慎起见,我会说不。统计学家的大多数工作至少需要统计学硕士学位,只是为了让你踏上大门,这是有原因的。经验丰富的统计学家通常拥有博士学位。

想象一下,一位医生要求您为特定治疗设计一个选择程序(我曾经做过)。你拿起你的统计书来复习一下,然后开始工作。您犯了一些数学错误,或者您无法识别一些潜伏的变量,并且选择了错误的人。砰! 亲属因疏忽和/或您因过失杀人而入狱。

因此,对于编程,自学是唯一的出路,但永远不要说你知道统计数据或在没有合格且经验丰富的统计学家指导的情况下从事统计项目,或者至少首先询问结果将用于什么。