医疗数据集的非参数方法?

数据挖掘 数据挖掘
2022-02-28 10:33:12

我有一个医疗保健数据集。我被告知要研究非参数方法来解决与数据集相关的某些问题。我对非参数方法有点困惑。

它们是指基于密度图的方法(例如查看直方图)吗?我知道这是一个模糊的问题。但是,我无法访问我可以询问的其他任何人,因此我在此论坛中寻求其他人的一些意见。

任何回应/想法将不胜感激。

谢谢并恭祝安康。

1个回答

他们并不是专门指基于情节的方法。他们指的是当数据不够正常或动力不足而无法使用常规统计数据时必须采用的一类方法。

参数和非参数是统计过程的两大类,它们之间的定义松散:

  • 参数检验通常假设数据近似正态分布。
  • 非参数检验不依赖于正态分布的数据假设。
  • 对非正态数据使用参数统计可能会导致错误的结果。
  • 如果您不确定您的数据是否足够正常或您的样本量是否足够大(n < 30),请使用非参数程序而不是参数程序。
  • 如果数据确实是正态的,那么对于相同的样本量,非参数过程通常比相应的参数过程具有更小的功效。

看看Tanya Hoskin 的 Demystifying Summary中的参数和类似非参数测试的一些示例:

在此处输入图像描述

以下是一些摘要参考: