我的回复在技术上与模糊集合而不是模糊逻辑更相关,但这两个概念实际上是不可分割的。几年前,我深入研究了有关模糊逻辑的学术期刊文章,以编写有关在 SQL Server 中实现模糊集的教程系列。虽然我很难被认为是专家,但我对文献相当熟悉,并且经常使用这些技术来解决实际问题。我从已发表的研究中获得的强烈印象是,模糊集的实际潜力仍未开发,这主要是由于对可以解决互补问题集的数十种其他技术家族的大量研究。
拥挤的数据科学/机器学习等思想市场。
支持向量机、神经网络、随机森林等方面的进步如此之快,以至于专家、分析师、数据科学家、程序员或他们产品的消费者不可能跟上这一切。在我的系列博客文章中,我详细谈到了模糊集和逻辑算法的开发通常比可用软件领先 20 多年,但许多相关领域也是如此;我深入阅读了神经网络,并能想到数十年前开发但从未广泛付诸实践的数十种有价值的神经架构,更不用说在易于使用的软件中编码了。话虽如此,模糊逻辑和集合在这个拥挤的思想市场中处于一个奇怪的劣势,主要是因为它们的绰号,当 Lofti A. Zadeh 创造它时,这个名字引起了争议。模糊技术的要点只是在连续尺度上逼近某些类别的离散值数据,但“逼近连续值逻辑”和“分级集”等术语并不十分引人注目。Zadeh 承认他使用“模糊”一词的部分原因是因为它很容易引起注意,但回头看,它可能巧妙地引起了错误的注意。
“模糊”一词如何适得其反
对于数据科学家、分析师或程序员来说,这个词可能会让人联想到“酷技术”;对那些对人工智能/数据挖掘/等感兴趣的人。等等,只有在它可以解决业务问题的范围内,“模糊”听起来像是不切实际的麻烦。对于公司经理、参与医学研究的医生或任何其他不知情的消费者来说,它可能会让人想起毛绒玩具、70 年代的警察表演或乔治·卡林冰箱里的东西。这两个群体之间在行业中一直存在紧张关系,后者经常仅仅为了求知欲而不是为了利润而限制前者编写代码和进行研究。除非第一组可以解释为什么这些模糊技术是有利可图的,否则第一组的谨慎将阻止它们的采用。
不确定性管理和模糊集应用系列
模糊集技术的重点是去除数据中已经固有的模糊,以不精确的离散值的形式,可以在近似的连续尺度上更好地建模,这与普遍的误解相反,即“模糊”是你添加的东西,比如披萨上的特殊配料。这种区别可能很简单,但它涵盖了广泛的潜在应用,从自然语言处理到决策理论再到非线性系统的控制。概率并没有像 Cliff AB 建议的那样吸收模糊逻辑,主要是因为它只是可以附加到模糊值的解释的一小部分。模糊隶属函数相当简单,它们只是通过分配一个或多个连续值来对记录属于特定集合的程度进行分级,通常在 0 到 1 的范围内(尽管对于某些应用程序,我' 我发现 -1 到 1 可能更有用)。我们赋予这些数字的含义取决于我们,因为它们可以表示我们想要的任何东西,例如贝叶斯信念度、对特定决策的信心、可能性分布、神经网络激活、缩放方差、相关性等,等等,不仅仅是 PDF、EDF 或 CDF 值。我在我的博客系列和这篇 CV 帖子,其中大部分是通过我最喜欢的模糊资源 George J. Klir 和 Bo Yuan 的 Fuzzy Sets and Fuzzy Logic: Theory and Applications (1995) 得出的。他们更详细地介绍了如何从模糊集中推导出整个“不确定性管理”程序。
如果模糊逻辑和集合是一种消费产品,我们可以说它由于缺乏营销和产品宣传以及品牌名称的自相矛盾而未能过时。在研究这一点时,我不记得曾遇到过一篇学术期刊文章,它试图以类似于 Minksy 和 Papert 关于感知器的臭名昭著的文章的方式揭穿这些应用程序。如今,在想法市场上存在大量竞争,以吸引开发人员、理论家、数据科学家等对适用于类似问题的产品的关注,这是快速技术进步的积极副作用。不利的一面是,这里有很多唾手可得的果实没有被采摘,尤其是在它们最适用的数据建模领域。