为了回答这个问题,我在阅读混沌理论时发现的最奇怪的事情是,已发表的惊人研究不足,其中数据挖掘及其亲属利用混沌理论。尽管进行了共同努力来找到它们,但是还是可以参考ABҪambel的《应用混沌理论:复杂性的范例》和Alligood等人的《混沌:动力学系统入门》(后者对于作为参考书非常有用)这个主题)并突袭他们的书目。毕竟,我只想提出一项可能合格的研究,因此我不得不扩大“数据挖掘”的范围,以包括这种极端情况:德克萨斯大学的一个团队对Belousov-Zhabotinsky(BZ)反应(已知容易发生非周期性)进行研究,由于混乱的模式,偶然发现了实验所用丙二酸的差异,促使他们寻求新的方法。供应商。[1] 可能还有其他人-我不是混沌理论的专家,很难对文献进行详尽的评估-但是,如果我们将它们全部列举出来,那么与普通科学用途(例如物理学中的三体问题)的明显不相称不会有太大变化。实际上,在此问题解决之时,我考虑将其重写为“为什么在数据挖掘和相关领域中很少有混沌理论的实现?” 这与不明确但普遍的观点不一致,即在神经网络,模式识别,不确定性管理,模糊集等数据挖掘和相关领域中应该有大量应用。毕竟,混沌理论也是具有许多有用应用的前沿话题。为了理解为什么我的搜索无济于事并且我的印象是错误的,我不得不认真思考这些领域之间的确切界限。
; tldr答案
关于研究数量的严重不平衡和与期望的偏离的简短解释可以归因于以下事实:混沌理论和数据挖掘等回答了两个整齐分开的问题。曾经指出,它们之间尖锐的二分法是显而易见的,但它是如此的基本以至于不被注意,就像看着自己的鼻子一样。也许有人会认为,混沌理论和数据挖掘等领域的相对新颖性解释了一些实现的不足,但即使这些领域成熟,我们也可以预期相对失衡将继续存在,因为它们只是解决了领域的明显不同方面。同一枚硬币。迄今为止,几乎所有的实现都在对已知功能的研究中,这些功能具有明确的输出,而这些输出恰好表现出一些令人费解的混沌像差,而数据挖掘和诸如神经网络和决策树之类的单个技术都涉及确定未知或定义不明确的功能。类似的相关领域,例如模式识别和模糊集,也可以看作是功能结果的组织,这些功能的结果也常常是未知的或定义不明确的,而该组织的方法也不是很明显。这创建了一个几乎无法克服的鸿沟,只有在某些罕见的情况下才能克服这一鸿沟,但即使是在单个用例的原则下,也可以将它们组合在一起:防止对数据挖掘算法的不定期干扰。类似的相关领域,例如模式识别和模糊集,也可以看作是功能结果的组织,这些功能的结果也常常是未知的或定义不明确的,而该组织的方法也不是很明显。这创建了一个几乎无法克服的鸿沟,只有在某些罕见的情况下才能克服这一鸿沟,但即使是在单个用例的原则下,也可以将它们组合在一起:防止对数据挖掘算法的不定期干扰。类似的相关领域,例如模式识别和模糊集,也可以看作是功能结果的组织,这些功能的结果也常常是未知的或定义不明确的,而该组织的方法也不是很明显。这创建了一个几乎无法克服的鸿沟,只有在某些罕见的情况下才能克服这一鸿沟,但即使是在单个用例的原则下,也可以将它们组合在一起:防止对数据挖掘算法的不定期干扰。
与混沌科学工作流程不兼容
“混沌科学”中的典型工作流程是对已知功能的输出进行计算分析,通常与相空间的视觉辅助一起使用,例如分叉图,Hénon映射,庞加莱截面,相图和相轨迹。研究人员依赖于计算实验的事实说明了很难找到混沌效应。通常,这不是笔和纸可以确定的。它们还专门出现在非线性函数中。除非我们有已知的功能要使用,否则此工作流程是不可行的。数据挖掘可能会产生回归方程,模糊函数等,但是它们都具有相同的局限性:它们只是一般的近似,误差范围更大。相比之下,已知功能容易混乱,就像产生混沌模式的输入范围一样,因此即使要测试混沌效果,也需要高度的特异性。存在于未知功能的相空间中的任何奇异吸引子,随着其定义和输入的改变,肯定会移动或完全消失,这极大地简化了Alligood等人概述的检测程序。
混沌是数据挖掘结果中的污染物
实际上,数据挖掘及其亲属与混沌理论的关系实际上是对抗性的。如果我们将密码分析广泛地视为一种特定的数据挖掘形式,这确实是正确的,因为我已经阅读了至少一篇有关利用加密方案中的混乱问题的研究论文(目前我找不到引文,但可以根据要求)。对于数据挖掘者来说,混乱的存在通常是一件坏事,因为它输出的看似无意义的值范围会极大地使逼近未知函数的过程变得复杂。在数据挖掘和相关领域中,混乱的最常见用法是排除它,这绝非易事。如果存在但未发现混乱的影响,那么它们对数据挖掘企业的影响可能难以克服。试想一下,普通的神经网络或决策树可能会多么容易地适应混沌吸引子的看似无意义的输出,或者输入值的突然尖峰肯定会混淆回归分析,并可能归因于不良样本或其他错误源。所有功能和输入范围之间的混沌效应都很罕见,这意味着对它们的研究将被实验人员严重剥夺优先权。
数据挖掘结果中的混沌检测方法
与混沌理论相关的某些度量可用于识别非周期性影响,例如Kolmogorov熵和要求相空间表现出正Lyapunov指数的要求。这些都在ABҪambel的Applied Chaos Theory中提供的用于混沌检测的清单[2]上,但是大多数对于近似函数(例如Lyapunov指数)没有用,它需要具有已知极限的确定函数。尽管如此,他概述的一般过程可能在数据挖掘情况中还是有用的。Ҫambel的目标最终是“混乱控制”程序,即消除干扰的非周期性影响。[3]在数据挖掘应用程序中,其他方法(例如,计算盒数和相关维数以检测导致混乱的分数维)可能比Lyapunov等人更实用。混乱效应的另一个明显迹象是函数输出中存在周期加倍(或三倍或更多)模式,这通常在相图中先于非周期性(即“混沌”)行为。
区分切向应用
必须将此主要用例与仅与混沌理论切线相关的单独应用程序区分开。经过仔细检查,我在问题中提供的“潜在应用程序”清单实际上几乎完全包含了利用混沌理论所依赖的概念的想法,但是可以在没有非周期性行为的情况下独立应用(周期性倍增除外)。我最近想到了一种新颖的潜在利基用途,它会产生非周期性行为,使神经网络脱离局部极小值,但这也属于切向应用程序列表。其中许多是由于对混沌科学的研究而被发现或充实的,但可以应用于其他领域。这些“切向应用程序”彼此之间只有模糊的联系,却形成了不同的类,与数据挖掘中的混沌理论的主要使用案例有一定的界限;前者利用混沌理论的某些方面而没有非周期性模式,而后者仅致力于排除混沌作为数据挖掘结果中的复杂因素,也许使用前提条件,例如Lyapunov指数的正性和检测周期加倍。如果我们区分混沌理论和它正确使用的其他概念,很容易看出前者的应用固有地局限于普通科学研究中的已知功能。在没有混乱的情况下,确实有充分的理由对这些次要概念的潜在应用感到兴奋,但也有理由担心意外的非周期性行为对数据挖掘工作的污染影响(如果存在)。这种情况很少见,但稀有性也意味着它们将不会被发现。Ҫambel的方法可能有助于避免此类问题。
[1]第143-147页,Alligood,Kathleen T .;Sauer,Tim D.和Yorke,James A.,2010,《混沌:动力学系统入门》,Springer:纽约。[2]第208-213页,, ambel,AB,1993年,《应用混沌理论:复杂性的范式》,学术出版社,公司:波士顿。[3] 215,Ҫambel。