在一列数据集上进行无监督学习(显示的图表)
数据挖掘
机器学习
无监督学习
2022-03-07 18:56:35
1个回答
一些意见/问题/考虑:
- 维基百科:无监督学习是一种自组织的 Hebbian 学习,它有助于在没有预先存在的标签的情况下在数据集中找到以前未知的模式。
- 作为一个异常是一个标签。
- 为什么不只是Z-score呢?https://en.wikipedia.org/wiki/Standard_score#Z-test。计算分布:和,并检查值是否在+/- 1.96,可能来自列中数字的正态分布。
- Value 列可以不是数字吗?(例如颜色名称)
- 或者它可能是一个有漂移的时间序列?
编辑:
在底层,机器学习基本上是一组关于列和行子集的智能统计和决策。但是只有一列并且没有时间序列,没有什么明智的选择或决定。然后本质上,它是元素的特殊 Z 分数。你必须决定有多少你要。
其它你可能感兴趣的问题
