我正在尝试从我的交易数据集中挖掘关联规则,并且我对规则的支持、信心和提升有疑问。
假设我们有像 {X} -> {Y} 这样的规则
我知道支持度是 P(XY),置信度是 P(XY)/P(X),提升度是 P(XY)/P(X)P(Y),其中提升度是 X 和 Y 独立性的度量(1代表独立)
但是,我只是不知道如何用这些指标解释规则。我有高支持、高信心和低提升的规则,这是一个好规则吗?
因为高信心代表强关联,高支持代表他们的关联有多么有说服力。如此高的信心+高支持=良好的规则,我们可以忽略提升?
如果我要对我的规则进行排序/排名并选择,比如说最好的 10 个来检查,应该选择哪个指标作为排名变量?