对于单变量核密度估计器 (KDE),我使用 Silverman 的计算规则:
多变量 KDE 的标准规则是什么(假设是 Normal 内核)。
对于单变量核密度估计器 (KDE),我使用 Silverman 的计算规则:
多变量 KDE 的标准规则是什么(假设是 Normal 内核)。
对于单变量 KDE,最好使用基于正态近似的 Silverman 规则以外的其他规则。一种出色的方法是 Sheather-Jones 方法,在 R 中很容易实现;例如,
plot(density(precip, bw="SJ"))
多变量 KDE 的情况没有得到很好的研究,工具也没有那么成熟。您需要带宽矩阵,而不是带宽。为了简化问题,大多数人假设一个对角矩阵,尽管这可能不会导致最好的结果。R 中的ks 包提供了一些非常有用的工具,包括允许完整(不一定是对角线)带宽矩阵。
对于单变量核密度估计,可以通过 Normal 参考规则或交叉验证方法或插件方法来估计带宽。
对于多元核密度估计,可以使用贝叶斯带宽选择方法,参见Zhang, X., ML King 和 RJ Hyndman (2006), A Bayesian approach to bandwidth selection for multivariate kernel density estimation, Computational Statistics and Data Analysis, 50, 3009-3031