假设我们被要求预测给定一组特征的东西,我们如何知道该目标是否实际上是可预测的?也就是说,我们如何知道依赖特征和独立特征之间是否真的存在某种关系,或者数据中是否存在一些可以被机器学习算法利用的模式?
如果目标结果只是随机的怎么办?在开始构建 ML/DL 模型之前,我们如何测试这种关系?
假设我们被要求预测给定一组特征的东西,我们如何知道该目标是否实际上是可预测的?也就是说,我们如何知道依赖特征和独立特征之间是否真的存在某种关系,或者数据中是否存在一些可以被机器学习算法利用的模式?
如果目标结果只是随机的怎么办?在开始构建 ML/DL 模型之前,我们如何测试这种关系?
这将是特征选择的一部分。有很多方法可以找出因变量和自变量之间是否存在关系。仅举几例:图、相关性度量、互信息度量。