粗糙、模糊、粒度计算

数据挖掘 机器学习 数据挖掘 分类
2021-09-18 04:34:47

对于我的计算智能课程,我正在对短文本进行分类。我发现的一篇论文大量使用了粒度计算,但我很难找到一个体面的解释来解释它到底是什么。

根据我从论文中收集到的信息,我觉得粒计算与模糊集非常相似。那么,究竟有什么区别。我也在询问粗糙集,因为我很好奇它们以及它们与模糊集的关系。如果有的话。

编辑:是我引用的论文。

1个回答

粒度”是指被分析变量的分辨率如果您正在分析人的身高,您可以使用只有少数可能值的粗粒度变量——例如“高于平均水平、平均水平、低于平均水平”——或细粒度变量,具有许多或无限值的数量——例如整数值或实数值。

如果替代值之间的区别不清晰,则度量是“模糊的”。在height的粗粒度变量中,“清晰”度量意味着任何给定的个人只能被分配一个值——例如,一个高个子的人要么是“高于平均水平”,要么是“平均水平”。相比之下,“模糊”度量允许每个值的隶属度, “隶属度”取值从 0 到 1.0。因此,高个子的人可能是“高于平均水平 0.5”、“平均水平 0.5”、“低于平均水平 0.0”的值。

最后,当给出两个值时,度量是“粗略的”:作为“清晰”度量的估计值的上限和下限。在我们的高个子示例中,粗略的衡量标准是{UPPER = 高于平均水平,LOWER = 平均水平}。

您可能会问,为什么要使用粒度、模糊或粗略的测量?为什么不用漂亮、精确的实数来衡量一切呢?因为许多现实世界的现象没有一个好的、可靠的内在测量和测量程序来产生一个实数。如果您要求已婚夫妇以 1 到 10 或 1.00 到 10.00 的等级对他们的婚姻质量进行评分,他们可能会给您一个数字(或数字范围),但这些报告的可靠性如何?使用粗略的测量(例如“快乐”、“中性/混合”、“不快乐”)、模糊测量或粗略测量可以在您的分析中更可靠和更可信。一般来说,使用粗略/粗略的措施比使用精确/细粒度的措施要好得多。