有很多内核可用于单变量 KDE。R 默认使用 normal,但功效讨论似乎支持使用 Epanechnikov。什么应该影响单变量探索性分析的内核选择?
如何为 KDE 选择内核
机器算法验证
分布
数据可视化
非参数
内核平滑
2022-03-19 09:24:19
2个回答
这不是一个真正的数据可视化问题。这些信息在网上很容易获得,例如http://homepages.inf.ed.ac.uk/rbf/CVonline/LOCAL_COPIES/AV0405/MISHRA/kde.html
提到使用 AMISE 选择带宽,可以使用相同的内核方法。但是对于 EDA,您可能希望像推荐的直方图一样工作,使用不同的 binwidth 重新绘制以了解数据中的不同内容。有时使用不同的内核可能会有所帮助。普通内核一般有用,我认为带宽比实际内核更重要。
我建议添加标签:分布,非参数。可能在这些主题下得到更好的答案。
正则化理论的框架(参见 Girosi 等人的正则化理论和神经网络架构)允许以系统的方式解决寻找良好内核的问题。
这个想法是内核由平滑稳定器确定,这类似于控制 MDL 意义上的复杂性或偏差方差误差分解。
这个想法是你试图解决这个问题, 其中是微分运算符,例如。现在可以证明这会导致以下解决方案, 其中是与正则化器相关的格林函数。通过交叉验证,您可以搜索良好的值和微分运算符的阶数。
其它你可能感兴趣的问题