离散化人工神经网络的连续输入

机器算法验证 机器学习 神经网络
2022-04-16 00:57:17

之前有人问一个与此类似的问题,但该问题的回答不够详细,无法解释我想知道的问题。

我一直在阅读人工神经网络 (ANN) 的介绍性材料。为连续值输入给出的示例总是使用单个输入神经元来获取变量的值。这就像下面的第一张图。

对我来说,这似乎是有限的。如果一个连续变量 X 可以取 1 到 10 之间的值,那么可以创建两个输入神经元,而不是具有一个值为 x 的单个输入神经元。如果 x 很小(在 1 和 5 之间),第一个神经元被激活,如果 x 很大(在 5 和 10 之间),第二个神经元被激活。这就像下面的第二张图。

第二个图中的这个输入离散化了 x,因此它丢失了一些关于 x 的信息,但我认为如果对 x 的响应应该根据 x 的大小而改变,这可能会很有用。例如,如果一个人工神经网络要确定一个人是男性还是女性,给定一个图像和这个人的年龄。ANN 应该根据人的年龄低或高来寻找不同的区别特征。

这种区分是否在实践中使用?它有很大的缺点吗?在某些情况下它仍然有用吗?

连续输入 离散输入

1个回答

您正在讨论问题制定,设计师定义输入变量及其特征。看看你展示的结构,如果你试图预测液体是冷冻的还是固体的,这样的结构会很有用。如果您试图预测变量的未来值,那么它的用处就会小得多。所以你的问题很抽象,所以答案是肯定的,这样的结构肯定会被使用,并且在某些情况下具有优势。但是机器学习的挑战与你提出的挑战相反。给定一个需要解决的问题,解决该问题的最佳变量和模型是什么。