我在使用 SVM 和 DT 的辐射暴露预测问题上得到了很好的结果,其中最终目标是使用与个人健康相关的数据来预测个人受到的辐射剂量。
总的来说,反馈是积极的,但有一条评论让我很感兴趣:如何确保机器学习不会通过错误的方式来正确分类?你是怎么排除这个的?
我采取了所有必要的预防措施来确保类不平衡、过度拟合等问题不是问题,所以我当然认为这与该领域的基础知识有关,而不是与机器学习方法问题有关。
如何从 ML 的角度开始解决这个问题,我觉得答案基本上可以归结为这样一个事实,即在完成所有可以优化模型性能(正则化、交叉验证等)的必要程序之后,有没有“以错误的方式得出正确的分类”之类的东西吗?
我觉得这实际上是一个需要一个很好的答案的问题,以便与可能不熟悉机器学习的观众进行任何技术交流(或者他们可能仍然想听听我们的想法)。