我有一个观察样本,其中大约的观察是右删失的。我想为这个样本拟合一个核密度估计器,但我还没有找到这样做的标准方法。在存在审查观察的情况下,是否有任何被广泛接受的方法来拟合 KDE?
用于审查数据的 KDE
机器算法验证
内核平滑
审查
密度估计
2022-03-22 15:43:51
2个回答
是的,这是可能的。为了对删失数据做任何事情,您至少需要假设“随机删失”,这表示在时间 t 删失的观测值的风险与在时间存在的未删失观测值的协变量条件相同。
与普通未经审查的 KDE 的主要区别在于,有效样本量会随着更多的观测值被审查而减少,因此恒定带宽不太可能是最优的。
最早的参考文献之一(现在开放获取)是Tanner & Wong 1983 年的一篇论文。有https://rdrr.io/cran/kernhaz/man/khazard.html和https://cran.r-project.org/web/packages/muhaz/index.html等实现
核密度估计经验分布的概率密度函数,它不“知道”和“关心”底层分布。“经验”是指它仅使用观察到的数据并做出最小的分布假设。显然,如果它使用观察到的数据,它就不能说任何关于审查的、未观察到的数据。如果你说分布被删失,这意味着你应该对底层分布有一些概念,所以你应该用它来定义一个参数模型来估计密度。
其它你可能感兴趣的问题