最近刚开始自学机器学习和数据分析,我发现自己在创建和查询大量数据的需求上遇到了障碍。我想收集我在职业和个人生活中积累的数据并对其进行分析,但我不确定执行以下操作的最佳方法:
我应该如何存储这些数据?Excel?SQL???
初学者开始尝试分析这些数据的好方法是什么?我是一名专业的计算机程序员,所以复杂性不在于编写程序,而是或多或少特定于数据分析领域。
编辑:为我的含糊道歉,当你第一次开始学习一些东西时,你很难知道你不知道什么,你知道吗?;)
话虽如此,我的目标是将其应用于两个主要主题:
软件团队指标(考虑敏捷速度、量化风险、给定 x 个故事点成功完成迭代的可能性)
机器学习(例如,给定的一组模块中发生了系统异常,一个模块在现场抛出异常的可能性有多大,成本是多少,数据可以告诉我哪些关键模块需要改进)我最划算,预测用户接下来要使用系统的哪个部分来开始加载数据等)。