为逻辑回归连接嵌入和手工设计的特征

数据挖掘 神经网络 深度学习 逻辑回归 嵌入
2021-09-17 15:45:05

一位面试官告诉我,我们不能将来自神经网络的嵌入(例如预训练的图像表示)和手工设计的特征(例如图像元数据)连接起来用于线性模型,例如逻辑回归。他说它们只能与神经网络一起使用。

我知道结果数据可能不是线性可分的,但对我来说这似乎是一个个案经验问题。

他是对的吗?有人可以解释为什么吗?

2个回答

我想我可以理解他们来自哪里。关键区别在于我们谈论的是推理还是训练。

  • 推理

没有什么能阻止你连接你的特征。无论是手工设计的还是神经网络的输出,都可以随意组合特征。

  • 训练

如果您不打算通过训练更新嵌入,那么就没有问题。您的嵌入将被视为其他一些功能,您可以训练您的下游模型。

如果您想同时训练下游模型和嵌入层,这将变得很棘手。实际上,只有当您的完整模型(NN + 下游模型)是可微的时,您才能训练嵌入层。例如,如果下游模型是 KNN 模型,这是不可能的。

我想这就是他们说你不能连接嵌入和手工设计的特性时的意思。

我不同意你的面试官,并同意@JulioJesus 的评论。事实上,由于逻辑回归一个简单的神经网络,面试官的陈述不可能是全局正确的。

但即使在更不同的情况下,例如作为最终分类器的决策树,我看不出有任何理由不应该同时包含预训练的嵌入特征和附加特征。您的树可能首先选择一些嵌入特征,然后为嵌入的每个结果子空间继续使用不同的附加特征。

现在确实,嵌入是由原始神经网络出于某种分类的目的而生成的,因此可能存在也可能不存在线性关系。从这个意义上说,嵌入特征可能无法在经典(尤其是线性)模型中发挥最佳作用。但在我看来,这与“不能使用”和“只能与神经网络一起使用”相去甚远。