我正在做机器学习项目。我查看了我使用的许多数据集,其中大部分已经有每个人都在使用的著名数据集。
假设我决定制作自己的数据集。我的数据是否有可能如此随机,以至于我的输入和输出之间不存在任何关系?这很有趣,因为如果这是可能的,那么任何机器学习模型都无法在数据中找到输入输出关系,并且无法解决回归或分类问题。
此外,在数学上是否有可能某些值之间完全没有关系?换句话说,没有函数(线性或非线性)可以将这些输入映射到输出。
现在,我考虑了这个问题并得出结论,如果有这种可能性,那么它很可能会发生在回归中,因为目标输出可能在相同的范围内,并且相同的特征值可以对应相同的输出值,并且会混淆机器学习模型。
你有没有遇到过这个或类似的问题?