当今最著名的数据科学方法论是什么?我所说的方法论是指一个可用于制定指导的分步阶段过程,尽管我也会感谢一些接近的东西。
为了帮助澄清,编程世界中有一些方法论,例如极限编程、功能驱动开发、统一过程等等。我正在寻找它们的等价物,如果它们存在的话。
谷歌搜索并没有出现太多,但我很难相信那里什么都没有。有任何想法吗?
当今最著名的数据科学方法论是什么?我所说的方法论是指一个可用于制定指导的分步阶段过程,尽管我也会感谢一些接近的东西。
为了帮助澄清,编程世界中有一些方法论,例如极限编程、功能驱动开发、统一过程等等。我正在寻找它们的等价物,如果它们存在的话。
谷歌搜索并没有出现太多,但我很难相信那里什么都没有。有任何想法吗?
你能详细说明你所说的“方法论”是什么意思吗?
同时,请查看 Booz Allen Hamilton 的The Field Guide To Data Science。本指南讨论数据科学流程和框架。
Mosaic 的Data Science Design Patterns谈到了,你猜对了,数据科学设计模式。这对于了解常见的设计模式非常有用。他们还在努力出版一本关于同一主题的书。
然后有一些资源将作为更有针对性的搜索的结果出现,例如机器学习范式、推荐系统范式等。数据科学是一个庞大而多样的领域,你会发现每个领域都有很多资源它的小节。据我所知,没有一本书能涵盖这一切。
我目前正在写一本关于高等教育数据科学的书,以下方法是我所包括的:
对于回归,我们有:
对于分类,我们有:
这些是统计分析中一些更基本的主题(你可以说是预测分析,你可以说是数据科学),因此我怀疑它们也更常见。
好的,我最终在数据挖掘社区中找到了我想要的东西。似乎有两个候选者,CRISP-DM 最初来自 SPSS,但它是“跨行业”,而 SEMMA 来自 SAS。它们几乎都是我想要的。
CRISP-DM http://en.wikipedia.org/wiki/Cross_Industry_Standard_Process_for_Data_Mining
和