我有一系列看似随机的数据,每次都滴入一个值。虽然看起来是随机的,但当分析图表显示的某些属性时,数据会形成集群。我试图避免看到不存在的模式的谬误,但在多个数据集中,数据确实似乎随着时间的推移形成了集群。我有兴趣尝试:
- 检测我拥有的数据中蓝色方块和/或白色方块的簇
- 忽略异常数据
- 随着数据一次滴入一列,预测集群的未来形状。(随着时间的推移,新数据的当前集群区域位于先前集群的附近区域的集群形状似乎存在一定的动量)
它们似乎呈现出规则的半可预测形状(至少在我看来)遵循之前数据的动量。我怎么能检测到这个?
我的问题是:
- 是这个聚类分析吗?
- 检测白色方块和/或蓝色区域的最佳方法是什么。我猜蓝色区域最容易聚集?
- 白色方块看起来非常接近之前的 y 值,并且可能会以某个角度向上或向下继续值。预测这一点的最佳方法是什么?