当您有多种方法来完成一项任务时,您如何选择实现哪一种?
在选择实施方法时如何避免“分析瘫痪”?
数据挖掘
管理
项目计划
2022-02-15 07:49:53
2个回答
这是一个非常广泛的问题,但一般来说,您可以定义一些您希望方法满足的标准(例如,低错误、效率、可扩展性),然后对方法进行评分,哪一个最能解决您的问题。
添加到 Dirk 的答案中,结构化方法是创建所谓的Algorithm/Model Test Harness。
见这里:https ://machinelearningmastery.com/create-algorithm-test-harness-scratch-python/
这使您可以传入各种学习算法,并根据您的一组质量指标快速评估它们。这些指标可以预先确定,并基于统计和特定领域的质量概念。
理想情况下,您创建一个包含学习算法、初始超参数、约束、上述限定符等的json结构,并将其传递到您的测试工具中。一切都在线束中进行评估,输出是一组它的准确性(和其他限定符)。
显然,如果您决定构建一个对 json 内容进行多种组合的测试工具,则需要考虑运行时。但这个想法是平衡你关于什么是最好的前期想法与使用测试工具实现的更多数据驱动的方法。
因此,从较小的数据样本开始,并构建一个模型测试工具来评估相当数量的组合。这将帮助您缩小选择范围,此时您可以开始用更少的前期假设进行更深入的思考。
其它你可能感兴趣的问题