我在数据科学/统计/数学方面完全没有背景。但是,我一直对数据显示的内容感兴趣。
我现在有一个庞大的数据集——过去 10 年中约 300 人的工厂的每日出勤率数据。我有兴趣找出问题的答案,例如是否存在与公共假期相关的树叶模式?例如,工人最有可能在哪个假期(+/- 2 天)休假?这是预期的模式。或者,在发放奖金后,准时报告是否有显着增加(+10%)。也许存在算法可以找到的隐藏模式。
有没有可以插入这些数据的工具来帮助我找到这些模式?谷歌告诉我有一个工具http://www.i-programmer.info/news/84-database/3501-mine-finding-patterns-in-big-data.html但我不确定这是否正确给我的方向。
我会很感激任何建议!