混沌理论在数据挖掘中已知的,现有的实际应用是什么?


13

在过去几年中随便阅读一些有关混沌理论的大众市场作品时,我开始想知道它的各个方面如何应用于数据挖掘和相关领域,例如神经网络,模式识别,不确定性管理等。到目前为止,我在已发表的研究中遇到了如此少的此类应用实例,我想知道是否a)它们实际上已在已知的,已发表的实验和项目中付诸实践,b)如果没有,为什么在这些相互关联的过程中却很少使用它们领域?

迄今为止,我所看到的大多数关于混沌理论的讨论都围绕着完全有用的科学应用展开,但与数据挖掘和模式识别等相关领域关系不大。物理学上的三体问题就是一个典型的例子。我想放弃对此类普通科学应用程序的讨论,而仅将问题局限于那些与数据挖掘和相关领域显然相关的应用程序,这些应用程序在文献中似乎很少。下面的潜在应用程序列表可以用作搜索已发表研究的起点,但是我只对那些实际上已经投入实践的应用程序感兴趣(如果有的话)。我正在寻找的是混沌理论对数据挖掘的已知实现,与潜在应用的清单相反,后者的范围要广得多。这是我在阅读时想到的有关数据挖掘应用程序的现成想法的一小部分;也许它们都不是实用的,也许有些在我们讲话时已经投入实际使用,但是按照我还不熟悉的术语去讲:

  1. 像几十年前Mandelbrot在模拟电话线中出现错误突发的情况下,Mandelbrot实际采用的方式一样,它可以识别模式识别中的相似结构。
  2. 在挖掘结果中遇到费根堡姆常数(也许以类似于弦理论家的方式震惊,他们发现麦克斯韦方程组在研究过程中突然出现在意外的地方)。
  3. 确定神经网络权重和各种挖掘测试的最佳位深度。我想知道这一点是因为数值尺度逐渐消失,对初始条件的敏感性开始发挥作用,部分原因是与混沌相关的函数的不可预测性。
  4. 以其他不一定与迷人的分形好奇心相关的方式使用分数维的概念,例如Menger Sponges,Koch Curves或Sierpinski Carpets。通过将该概念视为分数,可以以某种有益的方式将其应用于挖掘模型的维度吗?
  5. 推导幂函数定律,例如在分形中起作用的定律。
  6. 由于分形中遇到的函数是非线性的,所以我想知道非线性回归是否有实际应用。
  7. 混沌理论与熵之间存在切线(有时被夸大)关系,因此我想知道是否存在某种方法可以根据混沌理论中使用的函数来计算香农的熵(或对其及其亲属的限制),反之亦然。
  8. 识别数据中的周期倍增行为。
  9. 通过以一种有用的方式智能地选择最有可能“自我组织”的神经网络,从而确定神经网络的最佳结构。
  10. 混沌和分形等也与计算复杂度成切线关系,因此我想知道是否可以使用复杂度来识别混沌结构,反之亦然。
  11. 我首先听说了有关混沌理论的李雅普诺夫指数,从那时起,在特定神经网络的配方和熵的讨论中已经注意到了几次。

我可能没有在这里列出其他数十种关系。所有这些都浮现在我的头上。我对这些推测的具体答案并没有特别的兴趣,只是将它们作为可能在野外存在的应用程序类型的示例而扔掉了。我希望看到包含当前研究示例和此类想法的现有实现的答复,只要这些应用程序特别适用于数据挖掘。

即使在我更熟悉的领域(例如信息论,模糊集和神经网络),可能还有其他一些我不知道的现有实现,而我在其他领域的能力更弱,例如回归,因此输入更多不客气。我在这里的实际目的是确定是否对学习混沌理论的特定方面进行更多的投资,如果找不到明显的实用性,我将把它放在后面。

我搜索了CrossValidated,但没有看到任何直接解决混沌理论在数据挖掘中的功利性应用的主题。我能找到的最接近的主题是混沌理论,无方程建模和非参数统计。与特定的子集。


评论不作进一步讨论;此对话已转移至聊天
ub

Answers:


7

数据挖掘(DM)作为一种实用方法似乎与数学建模(MM)方法几乎互补,甚至与混沌理论(CT)相矛盾。我将首先谈谈DM和一般MM,然后再谈CT。

数学建模

在经济模型DM直到最近几乎被认为是一个禁忌,一劈到鱼的相关性,而不是学习的因果关系和人际关系,看到这个帖子在SAS博客。态度在变化,但是与虚假关系数据挖掘p-hacking等相关的陷阱很多。

在某些情况下,即使在具有公认的MM实践的领域中,DM似乎也是一种合法方法。例如,考虑到粒子粉碎机,DM可以用于在生成大量数据的物理实验中搜索粒子相互作用。在这种情况下,物理学家可能会对粒子的外观有所了解,然后在数据集中搜索模式。

混沌理论

混沌系统可能特别难以使用DM技术进行分析。考虑在常见的伪随机数生成器中使用的熟悉的线性同余方法(LCG)。它本质上是一个混沌系统。这就是为什么它被用来“伪造”随机数。好的生成器与随机数序列是无法区分的。这意味着您将无法使用统计方法来确定它是否是随机的。我还将在这里包括数据挖掘。尝试通过数据挖掘在RAND()生成的序列中查找模式!但是,正如您所知,它还是一个完全确定性的序列,其方程式也非常简单。

混沌理论不是关于随机寻找相似性模式。混沌理论涉及对过程和动态关系的了解,以使系统中的小干扰放大,从而产生不稳定的行为,而在这种混乱中,稳定模式就会出现。由于方程本身的性质,所有这些很酷的事情都会发生。然后,研究人员研究这些方程及其系统。这与应用数据挖掘的思路完全不同。

例如,您可以在研究混沌系统时谈论自相似模式,并注意数据挖掘者也谈论搜索模式。但是,这些处理“模式”的概念非常不同。混沌系统将根据方程式生成这些模式。他们可能会通过观察实际系统等来尝试得出他们的方程组,但是他们总是在某些时候处理方程。数据挖掘者将来自另一端,对系统的内部结构不了解或猜测太多,他们将尝试寻找模式。我认为这两个小组从来没有看过相同的实际系统或数据集。

另一个例子是费根鲍姆(Feigenbaum)使用的最简单的后勤图,以创建他著名的时期加倍分支。

在此处输入图片说明

该方程式非常简单: 但是,我不知道如何用数据挖掘技术来发现它。

xn+1=rxn(1xn)


(+1)。我要补充一点,当您可以精确确定决定混沌系统行为的方程式时,您可以完全或接近预测该行为。在数据挖掘/预测建模中,我们很少能够获得甚至> .5的R平方。
rolando2

+1这绝对是我已经准备好一段时间的回复的补充,我将在几个小时后发布。
SQLServerSteve19年

4

为了回答这个问题,我在阅读混沌理论时发现的最奇怪的事情是,已发表的惊人研究不足,其中数据挖掘及其亲属利用混沌理论。尽管进行了共同努力来找到它们,但是还是可以参考ABҪambel的《应用混沌理论:复杂性的范例》和Alligood等人的《混沌:动力学系统入门》(后者对于作为参考书非常有用)这个主题)并突袭他们的书目。毕竟,我只想提出一项可能合格的研究,因此我不得不扩大“数据挖掘”的范围,以包括这种极端情况:德克萨斯大学的一个团队对Belousov-Zhabotinsky(BZ)反应(已知容易发生非周期性)进行研究,由于混乱的模式,偶然发现了实验所用丙二酸的差异,促使他们寻求新的方法。供应商。[1] 可能还有其他人-我不是混沌理论的专家,很难对文献进行详尽的评估-但是,如果我们将它们全部列举出来,那么与普通科学用途(例如物理学中的三体问题)的明显不相称不会有太大变化。实际上,在此问题解决之时,我考虑将其重写为“为什么在数据挖掘和相关领域中很少有混沌理论的实现?” 这与不明确但普遍的观点不一致,即在神经网络,模式识别,不确定性管理,模糊集等数据挖掘和相关领域中应该有大量应用。毕竟,混沌理论也是具有许多有用应用的前沿话题。为了理解为什么我的搜索无济于事并且我的印象是错误的,我不得不认真思考这些领域之间的确切界限。

; tldr答案

关于研究数量的严重不平衡和与期望的偏离的简短解释可以归因于以下事实:混沌理论和数据挖掘等回答了两个整齐分开的问题。曾经指出,它们之间尖锐的二分法是显而易见的,但它是如此的基本以至于不被注意,就像看着自己的鼻子一样。也许有人会认为,混沌理论和数据挖掘等领域的相对新颖性解释了一些实现的不足,但即使这些领域成熟,我们也可以预期相对失衡将继续存在,因为它们只是解决了领域的明显不同方面。同一枚硬币。迄今为止,几乎所有的实现都在对已知功能的研究中,这些功能具有明确的输出,而这些输出恰好表现出一些令人费解的混沌像差,而数据挖掘和诸如神经网络和决策树之类的单个技术都涉及确定未知或定义不明确的功能。类似的相关领域,例如模式识别和模糊集,也可以看作是功能结果的组织,这些功能的结果也常常是未知的或定义不明确的,而该组织的方法也不是很明显。这创建了一个几乎无法克服的鸿沟,只有在某些罕见的情况下才能克服这一鸿沟,但即使是在单个用例的原则下,也可以将它们组合在一起:防止对数据挖掘算法的不定期干扰。类似的相关领域,例如模式识别和模糊集,也可以看作是功能结果的组织,这些功能的结果也常常是未知的或定义不明确的,而该组织的方法也不是很明显。这创建了一个几乎无法克服的鸿沟,只有在某些罕见的情况下才能克服这一鸿沟,但即使是在单个用例的原则下,也可以将它们组合在一起:防止对数据挖掘算法的不定期干扰。类似的相关领域,例如模式识别和模糊集,也可以看作是功能结果的组织,这些功能的结果也常常是未知的或定义不明确的,而该组织的方法也不是很明显。这创建了一个几乎无法克服的鸿沟,只有在某些罕见的情况下才能克服这一鸿沟,但即使是在单个用例的原则下,也可以将它们组合在一起:防止对数据挖掘算法的不定期干扰。

与混沌科学工作流程不兼容

“混沌科学”中的典型工作流程是对已知功能的输出进行计算分析,通常与相空间的视觉辅助一起使用,例如分叉图,Hénon映射,庞加莱截面,相图和相轨迹。研究人员依赖于计算实验的事实说明了很难找到混沌效应。通常,这不是笔和纸可以确定的。它们还专门出现在非线性函数中。除非我们有已知的功能要使用,否则此工作流程是不可行的。数据挖掘可能会产生回归方程,模糊函数等,但是它们都具有相同的局限性:它们只是一般的近似,误差范围更大。相比之下,已知功能容易混乱,就像产生混沌模式的输入范围一样,因此即使要测试混沌效果,也需要高度的特异性。存在于未知功能的相空间中的任何奇异吸引子,随着其定义和输入的改变,肯定会移动或完全消失,这极大地简化了Alligood等人概述的检测程序。

混沌是数据挖掘结果中的污染物

实际上,数据挖掘及其亲属与混沌理论的关系实际上是对抗性的。如果我们将密码分析广泛地视为一种特定的数据挖掘形式,这确实是正确的,因为我已经阅读了至少一篇有关利用加密方案中的混乱问题的研究论文(目前我找不到引文,但可以根据要求)。对于数据挖掘者来说,混乱的存在通常是一件坏事,因为它输出的看似无意义的值范围会极大地使逼近未知函数的过程变得复杂。在数据挖掘和相关领域中,混乱的最常见用法是排除它,这绝非易事。如果存在但未发现混乱的影响,那么它们对数据挖掘企业的影响可能难以克服。试想一下,普通的神经网络或决策树可能会多么容易地适应混沌吸引子的看似无意义的输出,或者输入值的突然尖峰肯定会混淆回归分析,并可能归因于不良样本或其他错误源。所有功能和输入范围之间的混沌效应都很罕见,这意味着对它们的研究将被实验人员严重剥夺优先权。

数据挖掘结果中的混沌检测方法

与混沌理论相关的某些度量可用于识别非周期性影响,例如Kolmogorov熵和要求相空间表现出正Lyapunov指数的要求。这些都在ABҪambel的Applied Chaos Theory中提供的用于混沌检测的清单[2]上,但是大多数对于近似函数(例如Lyapunov指数)没有用,它需要具有已知极限的确定函数。尽管如此,他概述的一般过程可能在数据挖掘情况中还是有用的。Ҫambel的目标最终是“混乱控制”程序,即消除干扰的非周期性影响。[3]在数据挖掘应用程序中,其他方法(例如,计算盒数和相关维数以检测导致混乱的分数维)可能比Lyapunov等人更实用。混乱效应的另一个明显迹象是函数输出中存在周期加倍(或三倍或更多)模式,这通常在相图中先于非周期性(即“混沌”)行为。

区分切向应用

必须将此主要用例与仅与混沌理论切线相关的单独应用程序区分开。经过仔细检查,我在问题中提供的“潜在应用程序”清单实际上几乎完全包含了利用混沌理论所依赖的概念的想法,但是可以在没有非周期性行为的情况下独立应用(周期性倍增除外)。我最近想到了一种新颖的潜在利基用途,它会产生非周期性行为,使神经网络脱离局部极小值,但这也属于切向应用程序列表。其中许多是由于对混沌科学的研究而被发现或充实的,但可以应用于其他领域。这些“切向应用程序”彼此之间只有模糊的联系,却形成了不同的类,与数据挖掘中的混沌理论的主要使用案例有一定的界限;前者利用混沌理论的某些方面而没有非周期性模式,而后者仅致力于排除混沌作为数据挖掘结果中的复杂因素,也许使用前提条件,例如Lyapunov指数的正性和检测周期加倍。如果我们区分混沌理论和它正确使用的其他概念,很容易看出前者的应用固有地局限于普通科学研究中的已知功能。在没有混乱的情况下,确实有充分的理由对这些次要概念的潜在应用感到兴奋,但也有理由担心意外的非周期性行为对数据挖掘工作的污染影响(如果存在)。这种情况很少见,但稀有性也意味着它们将不会被发现。Ҫambel的方法可能有助于避免此类问题。

[1]第143-147页,Alligood,Kathleen T .;Sauer,Tim D.和Yorke,James A.,2010,《混沌:动力学系统入门》,Springer:纽约。[2]第208-213页,, ambel,AB,1993年,《应用混沌理论:复杂性的范式》,学术出版社,公司:波士顿。[3] 215,Ҫambel。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.