科学论文中某个主题的机器学习方法比较

数据挖掘 机器学习 超参数 网格搜索
2021-10-16 03:58:24

作为我硕士论文的一部分,我在一个还没有论文的主题中使用机器学习方法对数据进行了预测。该主题是一个回归问题,已经测试了几种机器学习方法: SVR, RandomForestRegressor, GradientBoosting, DecisionTrees, Artificial Neural Networks, LSTMs, K-NearestNeighbors..

已经表明,所有方法都可以取得有用的结果。哪种方法最好很大程度上取决于参数配置。

测试任何方法的任何参数配置都需要做太多的工作。此外,我认为展示几十个关于参数调整测试的图会很无趣,因为它们也严重依赖于各自的数据集。

那么,您通常如何比较严重依赖参数的科学论文中不同类型的机器学习方法呢?只是玩一下网格搜索和随机搜索,直到您对参数配置感到满意?

2个回答

如果我理解,您可以根据您在使用正确的预处理、选择正确的功能、构建适当的架构(选择最适合问题的模型)方面的努力来评估您的方法。

每一步都会使损失减少,直到达到一个点,您将不得不搜索超参数以挤压每一个百分比的准确度,这是一个严重的计算问题。

你好,我不知道科学论文。

但我知道,要比较 ML 算法的质量,您需要建立一个指标:将其设为均方误差或其他任何值,一个最终数字可以告诉您您的算法是否按预期工作。

附带说明:每个算法,如果用于正确的目的,都高度依赖于参数。所以我不确定你指的是“严重依赖参数的机器学习方法”