其他答案是有道理的,但我会更明确地否定这个想法:
- 这种方法是正确的方法,还是就机器学习原理而言合乎逻辑?
不,这不对。ML 模型的参数(无论是监督的还是非监督的)是使用一组特定的特征来估计的,这些特征被设计为问题的输入。改变输入(特征)也改变了问题的定义,因此从第一个问题获得的解决方案(模型)不太可能在新问题上同样有效。
- 它会影响模型的准确性吗?如果是,那么如何?
这很可能会降低模型的性能。
通常选择模型中使用的特征是因为它们可能“帮助”模型。如果它们“有帮助”,那么模型将依赖它们,因此删除它们将导致模型失败。
- 如果我必须提供特征 B 和 C,那么我可以用零填充它们,然后将其提供给经过训练的模型以进行预测。
你当然可以,但这是个坏主意。
- 步骤 3) 中采取的措施是否会影响模型的准确性,如果是,那么为什么以及如何影响?
同第 2 点:性能很可能会下降。用任意值替换模型的有价值的指示相当于在生物实验室中随机切换血液样本,它会导致错误的测试和错误的结果。
另一种看待它的方式:如果您的建议是可能的,则意味着通常可以删除一个功能并获得相同的性能。所以假设我们有特征(A,B,C,D,E)的性能P,当我们移除A时,我们仍然有性能P。那么根据我们的假设,我们也可以移除B并且仍然获得性能P,然后做再次重复,直到我们获得一个具有 0 个特征且性能为 P 的模型。这是一个矛盾,因此可以在不损失性能的情况下删除特征的假设是错误的。