模糊逻辑发生了什么?

机器算法验证 模糊 模糊 C 均值聚类
2022-03-24 02:28:12

当我在读研究生时(2000 年代初),模糊逻辑似乎是机器学习和数据挖掘研究的一个活跃领域。模糊推理系统、模糊 c 均值、各种神经网络的模糊版本和支持向量机架构都在研究生课程中教授并在会议上讨论。

自从我再次开始关注 ML(~2013 年),Fuzzy Logic 似乎已经完全退出了地图,鉴于所有 AI 炒作,它在当前 ML 领域的缺席是显而易见的。

这是一个主题简单过时的案例,还是模糊逻辑和模糊推理的特定限制导致该主题被研究人员抛弃?


澄清一下,根据 jbowman 的评论:是否有一些事件或发现导致 FL 过时,例如类似于 60 年代的神经网络,当时它们过时了,因为事实证明它们无法解决 XOR ? 还是模糊系统的表现优于竞争范式?

2个回答

我的回复在技术上与模糊集合而不是模糊逻辑更相关,但这两个概念实际上是不可分割的。几年前,我深入研究了有关模糊逻辑的学术期刊文章,以编写有关在 SQL Server 中实现模糊集的教程系列。虽然我很难被认为是专家,但我对文献相当熟悉,并且经常使用这些技术来解决实际问题。我从已发表的研究中获得的强烈印象是,模糊集的实际潜力仍未开发,这主要是由于对可以解决互补问题集的数十种其他技术家族的大量研究。

拥挤的数据科学/机器学习等思想市场。

支持向量机、神经网络、随机森林等方面的进步如此之快,以至于专家、分析师、数据科学家、程序员或他们产品的消费者不可能跟上这一切。在我的系列博客文章中,我详细谈到了模糊集和逻辑算法的开发通常比可用软件领先 20 多年,但许多相关领域也是如此;我深入阅读了神经网络,并能想到数十年前开发但从未广泛付诸实践的数十种有价值的神经架构,更不用说在易于使用的软件中编码了。话虽如此,模糊逻辑和集合在这个拥挤的思想市场中处于一个奇怪的劣势,主要是因为它们的绰号,当 Lofti A. Zadeh 创造它时,这个名字引起了争议。模糊技术的要点只是在连续尺度上逼近某些类别的离散值数据,但“逼近连续值逻辑”和“分级集”等术语并不十分引人注目。Zadeh 承认他使用“模糊”一词的部分原因是因为它很容易引起注意,但回头看,它可能巧妙地引起了错误的注意。

“模糊”一词如何适得其反

对于数据科学家、分析师或程序员来说,这个词可能会让人联想到“酷技术”;对那些对人工智能/数据挖掘/等感兴趣的人。等等,只有在它可以解决业务问题的范围内,“模糊”听起来像是不切实际的麻烦。对于公司经理、参与医学研究的医生或任何其他不知情的消费者来说,它可能会让人想起毛绒玩具、70 年代的警察表演或乔治·卡林冰箱里的东西。这两个群体之间在行业中一直存在紧张关系,后者经常仅仅为了求知欲而不是为了利润而限制前者编写代码和进行研究。除非第一组可以解释为什么这些模糊技术是有利可图的,否则第一组的谨慎将阻止它们的采用。

不确定性管理和模糊集应用系列

模糊集技术的重点是去除数据中已经固有的模糊,以不精确的离散值的形式,可以在近似的连续尺度上更好地建模,这与普遍的误解相反,即“模糊”是你添加的东西,比如披萨上的特殊配料。这种区别可能很简单,但它涵盖了广泛的潜在应用,从自然语言处理到决策理论再到非线性系统的控制。概率并没有像 Cliff AB 建议的那样吸收模糊逻辑,主要是因为它只是可以附加到模糊值的解释的一小部分。模糊隶属函数相当简单,它们只是通过分配一个或多个连续值来对记录属于特定集合的程度进行分级,通常在 0 到 1 的范围内(尽管对于某些应用程序,我' 我发现 -1 到 1 可能更有用)。我们赋予这些数字的含义取决于我们,因为它们可以表示我们想要的任何东西,例如贝叶斯信念度、对特定决策的信心、可能性分布、神经网络激活、缩放方差、相关性等,等等,不仅仅是 PDF、EDF 或 CDF 值。我在我的博客系列和这篇 CV 帖子,其中大部分是通过我最喜欢的模糊资源 George J. Klir 和 Bo Yuan 的 Fuzzy Sets and Fuzzy Logic: Theory and Applications (1995) 得出的。他们更详细地介绍了如何从模糊集中推导出整个“不确定性管理”程序。

如果模糊逻辑和集合是一种消费产品,我们可以说它由于缺乏营销和产品宣传以及品牌名称的自相矛盾而未能过时。在研究这一点时,我不记得曾遇到过一篇学术期刊文章,它试图以类似于 Minksy 和 Papert 关于感知器的臭名昭著的文章的方式揭穿这些应用程序。如今,在想法市场上存在大量竞争,以吸引开发人员、理论家、数据科学家等对适用于类似问题的产品的关注,这是快速技术进步的积极副作用。不利的一面是,这里有很多唾手可得的果实没有被采摘,尤其是在它们最适用的数据建模领域。

我不清楚模糊逻辑思想(在 ML 中)过时的原因。可能有很多原因,无论是技术的、社会学的等等……可以肯定的是,过去几年 ML 的数学一直由概率/统计和优化主导,这两个领域模糊逻辑(或从模糊文献中提出的想法)可以填写,但它们通常带来的答案多于问题。概率和优化的另一个优点是,虽然它们内部可能存在不同的趋势/解释(例如,贝叶斯与常客),但基本的形式/数学框架对于那些来说是相当稳定的(在我看来,模糊逻辑不太清楚广义的理解)。

  • Hüllermeier, E. (2015)。机器学习需要模糊逻辑吗?模糊集和系统,281、292-299。

我认为模糊逻辑的基本思想之一,即对渐进的概念进行建模并提供与之相关的推理工具(主要是扩展逻辑,但不仅仅是),仍然存在于一些机器学习思想中,包括最近的一些思想。你只需要仔细寻找它,因为它相当罕见。两个例子包括:

  • Farnadi, G., Bach, SH, Moens, MF, Getoor, L. 和 De Cock, M. (2017)。统计关系学习中的软量化。机器学习,106(12),1971-1991。(参考文献包括模糊逻辑,包括 Zadeh 开创性论文)
  • Cheng, W.、Rademaker, M.、De Baets, B. 和 Hüllermeier, E.(2010 年 9 月)。预测偏序:弃权排序。在关于数据库中机器学习和知识发现的欧洲联合会议上(第 215-230 页)。施普林格,柏林,海德堡。

总体而言,要从更个人的角度回答您的问题,我的感觉是,对于模糊逻辑可以完成什么(在最近的 ML 观点中)概率无法完成的事情并没有清晰的认识,而且由于后者更老并且显然适合使用 ML 框架更好地查看从概率群体发出的数据,使用概率和统计数据比使用模糊逻辑更自然。这也意味着,如果你想在 ML 中使用模糊逻辑,你必须提出一个令人信服的、充分的理由来这样做(例如,利用它们通过提供可微分函数来扩展逻辑的事实,以便你可以在深度学习中包含逻辑规则技术)。