首先,对于文本分类问题,如果我已经在 2 个类上训练了模型并且它给出了很好的准确性。现在,当我实时使用模型时,有一个来自完全不同的业务团队的全新课程,我需要使用经过训练的模型并测试这些数据。在这里,显然模型会产生更差的结果,而且预处理或任何其他数据清理可能会大不相同。所以,问题是 - 唯一可能的方法是再次重新训练模型吗?
其次,在细分问题中,方法是使用 K-Means 聚类和分组客户。在实时环境中,我们如何处理新数据点?我们如何知道数据点属于哪个组?因为模型已正确标准化/标准化,然后进行了拟合。对于新的数据点,不能指望同样的情况。我们如何处理这个?