“大 p,小 n”结果总结

机器算法验证 回归 分类 多元分析
2022-02-10 07:35:00

谁能指点我一份关于“大p, 小的n“结果?我感兴趣的是这个问题如何在不同的研究环境中表现出来,例如回归、分类、Hotelling 测试

4个回答

我不知道一篇论文,但我认为当前的书对适用于的方法进行了最好的调查pn仍然是弗里德曼-哈斯蒂-蒂布希拉尼。它非常偏向收缩和套索(我从一个熟人那里知道,Vapnik 对本书的第一版感到不满),但涵盖了几乎所有常见的收缩方法,并显示了它们与 Boosting 的联系。谈到 Boosting,Buhlmann & Hothorn 的调查也显示了与收缩的联系。

我的印象是,虽然分类和回归可以使用相同的理论框架进行分析,但对高维数据的测试是不同的,因为它没有与模型选择程序结合使用,而是关注家庭错误率。不太确定那里的最佳调查。Brad Efron 在他的页面上有大量的论文/调查/书籍把它们都读一遍,让我知道我应该读的那一本……

“结果”理论结果是什么意思?还是数值结果?

我喜欢范建清的评论,例如这个这个关于分类的评论(很多自引)。

还有一些非评论论文在介绍中进行了丰富的评论,例如 this onethis one

如果你想要一份简历,也许这是你能得到的最好的

http://www.springer.com/statistics/statistical+theory+and+methods/book/978-3-642-20191-2

Hastie、Tibshirani 和 Friedman的第 18 章(第 12 次印刷/第二版,这一章不在第一版中)很好地概述了一些有趣的数据集。它不像他们对旧材料的处理那么彻底,而且很多时候他们不得不给出一些启发式的解释,说明为什么某些算法比其他算法更好。我发现它与阅读论文一起非常有用,可以更深入地了解您想了解的内容。