机器学习的统计,论文开始?

机器算法验证 机器学习 估计
2022-03-08 00:19:39

我有计算机编程和初等数论的背景,但没有真正的统计培训,最近“发现”了一系列技术的惊人世界实际上是一个统计世界。似乎矩阵分解、矩阵补全、高维张量、嵌入、密度估计、贝叶斯推理、马尔可夫分区、特征向量计算、PageRank 都是高度统计的技术,而使用这些东西的机器学习算法使用了大量的统计数据.

我的目标是能够阅读讨论此类事情的论文,并实现或创建算法,同时理解所使用的符号、“证明”和统计参数。我想最难的事情是遵循所有涉及矩阵的证明。

哪些基础论文可以帮助我入门?还是一本包含值得学习的练习的好教科书?

具体来说,我想完全理解的一些论文是:

  1. 通过凸优化完成精确矩阵,Candes,Recht,2008
  2. 快速柯西变换和更快的鲁棒线性回归,Clarkson 等人,2013
  3. 支持向量机的随机投影,Paul 等人,2013
  4. 使用深密度模型进行高维概率估计,Rippel,Adams,2013
  5. 获得用于低秩矩阵完成的错误最小化估计和通用输入错误界限,Király,Theran,2013
1个回答

我会推荐 Coursera 上的 Andrew Ngs 机器学习课程,它涵盖了所有基础知识。如果您正在研究与概率图形模型有关的任何事情,那么 Daphne Kollers 的课程也可以看看。

这也是自学资源的宝库http://rgle.sanukcode.net/articles/machine-learning-self-study-resources/ Herb Grossman 的讲座很棒。

我也被推荐这本书https://www.openintro.org/stat/textbook.php因为我一直在学习自己并且统计不是我的背景!

我的两分钱是关于事物和论文的数学方面的,不过不要太沉迷于背景数学。学习基础知识并参考您提到的那些论文所依据的论文,看看它们是否更容易(也许您必须返回几篇论文才能获得您可以理解的东西 - 这是我自己做的)有很多ML 中的不同数学元素,很容易陷入困境(这也是我自己不止一次做过的事情!)。

祝你好运,这是一个非常有趣的领域!