当我发现机器学习时,我看到了不同的有趣技术,例如:
- 使用以下技术自动调整算法
grid search
, - 通过相同“类型”的不同算法组合得到更准确的结果,即
boosting
, - 通过不同算法(但不是同一类型的算法)的组合得到更准确的结果,即
stacking
, - 可能还有更多我还需要发现......
我的问题是:有所有这些碎片。但是,是否有可能将它们组合在一起形成一个算法,将清理过的数据作为输入,并通过充分利用所有技术来输出良好的结果?(当然,专业数据科学家的效率可能会更低,但他会比我更好!)如果有,您是否有示例代码或者您知道可以做到这一点的框架?
编辑:在一些答案之后,似乎必须进行一些缩小。举个例子,我们有一列包含分类数据,我们称之为它y
,我们想从X
虚拟数据或真实数字数据(高度、温度)的数字数据中预测它。我们假设之前已经完成了清洁工作。是否存在可以获取此类数据并输出预测的现有算法?(通过测试多种算法,调整它们,提升等)如果是,它是否具有计算效率(如果我们与普通算法相比,计算是否在合理的时间内完成),你有代码示例吗?