了解没有给出元数据的数据集(在应用 ML 模型之前)

数据挖掘 机器学习 数据集 数据分析 元数据
2022-03-05 02:50:06

当没有给出元数据(没有关于数据集中给出的属性的详细信息)时,您如何理解数据集?由于只给出了简短的形式,因此很难理解属性名称。

它给了我'pm2.5'是目标变量。我如何理解哪些自变量会影响这个目标变量?

在此处输入图像描述

1个回答

目的是预测 pm2.5(目标变量)。

第 1 步:数据清理。删除不需要的特征并填充缺失的值。

第 2 步:要了解这些功能,请执行数据可视化。您可以使用 TEMP 和 pm2.5 绘制线性图,并查看它如何随温度变化而变化。

第三步:下一步是寻找特征之间的关系。预测不需要某些特征。删除这些功能。

第 4 步:应用合适的机器学习技术并进行预测。