我不认为这是一个困难的问题,但我想有人需要经验来回答它。这是一个在这里被很多人问到的问题,但我没有找到任何答案来解释选择合适的 ML 算法的原因。
所以,假设我们有一组数据。假设我想做聚类(如果我也有标签或值或我的训练集数据,这可能是分类或回归)。
在选择合适的之前我应该考虑什么algorithm?或者我只是随机选择算法?
此外,我如何选择preprocessing可以应用于我的数据的任何数据?我的意思是有任何格式“ IF feature X has property Z THEN do Y”的规则吗?
此外,除了预处理和选择我想念的数据之外,还有什么其他的事情,你想给我一些建议吗?
例如,假设我想做聚类。说“ I will apply k means at that problem”是最好的方法吗?什么可以提高我的表现?
我将选择更合理的答案作为最佳答案,并解释人们应该考虑的一切。