了解没有给出元数据的数据集(在应用 ML 模型之前)
数据挖掘
机器学习
数据集
数据分析
元数据
2022-03-05 02:50:06
1个回答
目的是预测 pm2.5(目标变量)。
第 1 步:数据清理。删除不需要的特征并填充缺失的值。
第 2 步:要了解这些功能,请执行数据可视化。您可以使用 TEMP 和 pm2.5 绘制线性图,并查看它如何随温度变化而变化。
第三步:下一步是寻找特征之间的关系。预测不需要某些特征。删除这些功能。
第 4 步:应用合适的机器学习技术并进行预测。
