我有计算机编程和初等数论的背景,但没有真正的统计培训,最近“发现”了一系列技术的惊人世界实际上是一个统计世界。似乎矩阵分解、矩阵补全、高维张量、嵌入、密度估计、贝叶斯推理、马尔可夫分区、特征向量计算、PageRank 都是高度统计的技术,而使用这些东西的机器学习算法使用了大量的统计数据.
我的目标是能够阅读讨论此类事情的论文,并实现或创建算法,同时理解所使用的符号、“证明”和统计参数。我想最难的事情是遵循所有涉及矩阵的证明。
哪些基础论文可以帮助我入门?还是一本包含值得学习的练习的好教科书?
具体来说,我想完全理解的一些论文是: