当我阅读有关如何设置数据的信息时,我经常遇到的一件事是将一些连续数据转换为分类数据不是一个好主意,因为如果阈值确定不当,您很可能会得出错误的结论。
然而,我目前有一些数据(前列腺癌患者的 PSA 值),我认为普遍的共识是,如果你低于 4 岁,你可能没有,如果你高于你有风险,然后类似超过 10 和 20,你可能拥有它。类似的东西。在这种情况下,将我的连续 PSA 值分类为 0-4、4-10 和 >10 组是否仍然不正确?或者实际上可以说阈值是“确定的”。
当我阅读有关如何设置数据的信息时,我经常遇到的一件事是将一些连续数据转换为分类数据不是一个好主意,因为如果阈值确定不当,您很可能会得出错误的结论。
然而,我目前有一些数据(前列腺癌患者的 PSA 值),我认为普遍的共识是,如果你低于 4 岁,你可能没有,如果你高于你有风险,然后类似超过 10 和 20,你可能拥有它。类似的东西。在这种情况下,将我的连续 PSA 值分类为 0-4、4-10 和 >10 组是否仍然不正确?或者实际上可以说阈值是“确定的”。