我采用了两种不同的方法来计算概率:使用 GLM 和 SVM。他们给出的结果略有不同(这是可以理解的,它们是完全不同的方法)。不过,这两种方法都被证明通常是准确的,并且在预测方面做着类似的工作。
鉴于很难选择哪种方法更好,我只是想知道对这两个结果进行平均是否有任何价值,例如,如果项目 A 根据 SVM 可能有 0.65 发生,根据 GLM 可能有 0.71,那么将 0.68 作为概率.
这听起来不错——同时受益于常客方法和 ML 方法?还是只是没有真实依据的糟糕统计数据?
我采用了两种不同的方法来计算概率:使用 GLM 和 SVM。他们给出的结果略有不同(这是可以理解的,它们是完全不同的方法)。不过,这两种方法都被证明通常是准确的,并且在预测方面做着类似的工作。
鉴于很难选择哪种方法更好,我只是想知道对这两个结果进行平均是否有任何价值,例如,如果项目 A 根据 SVM 可能有 0.65 发生,根据 GLM 可能有 0.71,那么将 0.68 作为概率.
这听起来不错——同时受益于常客方法和 ML 方法?还是只是没有真实依据的糟糕统计数据?
这(可能)很好。您正在描述模型平均的简单版本。当然,在您的情况下是否实际上更好是一个经验问题。
就其价值而言,“常客”与“机器学习”并没有真正的对比。在统计学中,常客会与贝叶斯形成对比,但这种区别与这个问题是正交的。您可以将统计数据与机器学习进行对比(很多人都这样做),但我认为这种区别有些强制性和人为的,无论如何,它与这个问题是正交的。