为了回答这个问题,我在阅读混沌理论时发现的最奇怪的事情是数据挖掘及其相关领域利用混沌理论的已发表研究的惊人缺乏。尽管通过查阅 AB Ҫambel 的 Applied Chaos Theory: A Paradigm for Complexity 和 Alligood 等人的 Chaos: An Introduction to Dynamical Systems(后者作为这个主题)和突袭他们的书目。毕竟,我只是想出了一个可能符合条件的研究,我不得不扩展“数据挖掘”的范围,只为了包括这个边缘案例:德克萨斯大学的一个团队对 Belousov-Zhabotinsky (BZ) 反应(已知容易出现非周期性)进行研究,意外发现由于混沌模式而在他们的实验中使用的丙二酸存在差异,促使他们寻求新的供应商。[1] 可能还有其他的——我不是混沌理论的专家,很难对文献进行详尽的评价——但是如果我们将它们全部列举出来,与物理学中的三体问题等普通科学用途的明显不成比例不会有太大变化。事实上,在这个问题结束的过程中,我考虑将其改写为“为什么混沌理论在数据挖掘及相关领域的实现如此之少?” 这与在数据挖掘和相关领域(如神经网络、模式识别、不确定性管理、模糊集等)中应该有大量应用的定义不明确但普遍存在的观点不一致;毕竟,混沌理论也是一个具有许多有用应用的前沿话题。我必须仔细思考这些领域之间的界限到底在哪里,才能理解为什么我的搜索没有结果,我的印象是错误的。
;tldr 答案
对这种研究数量的严重不平衡和与预期的偏差的简短解释可以归因于混沌理论和数据挖掘等回答了两类完全分开的问题。一旦指出,它们之间的尖锐二分法就很明显,但又如此根本以至于被忽视,就像看自己的鼻子一样。混沌理论和数据挖掘等领域的相对新颖性解释了实现的一些缺乏,这可能有一些理由,但我们可以预期,即使这些领域成熟,相对不平衡仍会持续存在,因为它们只是解决了不同方面的问题。同一枚硬币。迄今为止,几乎所有的实现都在研究具有明确定义的输出的已知函数,这些函数恰好表现出一些令人费解的混沌畸变,而数据挖掘和诸如神经网络和决策树之类的单个技术都涉及确定未知或定义不明确的函数。模式识别和模糊集等相关领域同样可以被视为功能结果的组织,这些功能通常也是未知或定义不明确的,而该组织的手段也不是很明显。这创造了一个实际上无法逾越的鸿沟,只能在某些罕见的情况下跨越——但即使是这些也可以在一个用例的标题下组合在一起:防止对数据挖掘算法的非周期性干扰。模式识别和模糊集等相关领域同样可以被视为功能结果的组织,这些功能通常也是未知或定义不明确的,而该组织的手段也不是很明显。这创造了一个实际上无法逾越的鸿沟,只能在某些罕见的情况下跨越——但即使是这些也可以在一个用例的标题下组合在一起:防止对数据挖掘算法的非周期性干扰。模式识别和模糊集等相关领域同样可以被视为功能结果的组织,这些功能通常也是未知或定义不明确的,而该组织的手段也不是很明显。这创造了一个实际上无法逾越的鸿沟,只能在某些罕见的情况下跨越——但即使是这些也可以在一个用例的标题下组合在一起:防止对数据挖掘算法的非周期性干扰。
与混沌科学工作流程不兼容
“混沌科学”中的典型工作流程是对已知函数的输出进行计算分析,通常与相空间的视觉辅助工具一起进行,如分岔图、Hénon 映射、庞加莱截面、相图和相轨迹。研究人员依赖计算实验这一事实说明了发现混沌效应是多么困难。这不是您通常可以用笔和纸来确定的。它们也只出现在非线性函数中。除非我们有一个已知的函数可以使用,否则这个工作流程是不可行的。数据挖掘可能会产生回归方程、模糊函数等,但它们都具有相同的局限性:它们只是一般的近似值,具有更宽的误差窗口。相比之下,受混沌影响的已知函数相对较少,与产生混沌模式的输入范围一样,因此即使测试混沌效应也需要高度的特异性。任何出现在未知函数相空间中的奇怪吸引子肯定会随着它们的定义和输入的变化而完全改变或消失,这使得 Alligood 等作者概述的检测程序变得非常复杂。
混沌作为数据挖掘结果中的污染物
事实上,数据挖掘及其亲属与混沌理论的关系实际上是对立的。如果我们将密码分析广义地视为一种特定形式的数据挖掘,这确实是真的,因为我至少看过一篇关于在加密方案中利用混乱的研究论文(我目前找不到引用,但可以搜索它应要求而下降)。对于数据挖掘者来说,混沌的存在通常是一件坏事,因为它输出的看似荒谬的值范围会使逼近未知函数的本已艰巨的过程大大复杂化。在数据挖掘和相关领域中,混沌最常见的用途是排除它,这绝非易事。如果存在混沌效应但未被发现,它们对数据挖掘企业的影响可能难以克服。想想普通的神经网络或决策树有多么容易过度拟合混沌吸引子看似荒谬的输出,或者输入值的突然尖峰肯定会混淆回归分析,并可能归因于错误的样本或其他错误来源。所有函数和输入范围中混沌效应的罕见性意味着对它们的研究将被实验者严重剥夺优先权。
在数据挖掘结果中检测混沌的方法
与混沌理论相关的某些度量可用于识别非周期效应,例如 Kolmogorov 熵和相空间呈现正 Lyapunov 指数的要求。这些都在 AB Ҫambel 的应用混沌理论中提供的混沌检测清单 [2] 中,但大多数都不适用于近似函数,例如 Lyapunov 指数,它需要具有已知限制的明确函数。他概述的一般程序在数据挖掘情况下可能仍然有用。Ҫambel 的目标最终是“混沌控制”计划,即消除干扰的非周期效应。[3] 在数据挖掘应用中,计算盒计数和相关维度等其他方法可能比 Lyapunov 和他列表中的其他人更实用。混沌效应的另一个明显迹象是函数输出中存在周期加倍(或三倍及以上)模式,这通常先于相图中的非周期(即“混沌”)行为。
区分切向应用
这个主要用例必须与仅与混沌理论切线相关的单独一类应用程序区分开来。仔细观察,我在问题中提供的“潜在应用”列表实际上几乎完全包含利用混沌理论所依赖的概念的想法,但可以在没有非周期性行为的情况下独立应用(周期加倍除外)。我最近想到了一种新的潜在利基用途,产生非周期性行为以将神经网络从局部最小值中弹出,但这也属于切向应用列表。其中许多是由于对混沌科学的研究而发现或充实的,但可以应用于其他领域。这些“切向应用”彼此之间只有模糊的联系,却形成了一个独特的类别,与数据挖掘中混沌理论的主要用例有硬性界限;第一个利用混沌理论的某些方面而没有非周期性模式,而后者专门用于排除混沌作为数据挖掘结果中的一个复杂因素,可能使用诸如李雅普诺夫指数的正性和周期倍增检测等先决条件. 如果我们区分混沌理论和它正确使用的其他概念,很容易看出前者的应用本质上仅限于普通科学研究中的已知函数。在没有混乱的情况下,确实有充分的理由对这些次要概念的潜在应用感到兴奋,但也有理由担心出现意外的非周期性行为对数据挖掘工作的污染影响。这种情况很少见,但这种罕见也可能意味着它们不会被发现。不过,安贝尔的方法可能有助于避免此类问题。
[1] 第 143-147 页,Alligood, Kathleen T.;Sauer, Tim D. 和 Yorke, James A.,2010,混沌:动力系统简介,施普林格:纽约。[2] pp. 208-213, Ҫambel, AB, 1993, Applied Chaos Theory: A Paradigm for Complexity, Academic Press, Inc.:波士顿。[3] 页。215,安贝尔。