“真正困难的问题在哪里”坚持了吗?关于这个主题的最新想法是什么?


27

我发现这篇论文非常有趣。总结一下:它讨论了为什么在实践中您很少发现NP完全问题的最坏情况。本文中的想法是,实例通常要么受约束不足,要么受约束过度,这两种情况都相对容易解决。然后针对一些问题提出了一种“约束”措施。这些问题似乎具有从解决方案的0可能性到100%可能性的“相变”。然后假设:

  1. 所有NP完全(甚至所有NP问题)问题都有一定程度的“约束”。
  2. 对于每个NP完全问题,您都可以根据“约束”来创建存在解的概率图。而且,该图将包含一个相变,在该相变中该概率迅速而急剧地增加。
  3. NP完全问题最坏的例子是该相变。
  4. 问题是否在于该相变这一事实在将一个NP完全问题转换为另一个NP完全问题时仍然是不变的。

该论文于1991年发表。我的问题是,过去25年中是否有关于这些想法的后续研究?如果是这样,当前对它们的主流想法是什么?他们发现正确,不正确,无关紧要吗?


TCS社区已广泛研究了CSP,k-sat,k-color的随机实例。例如,我们可以有效解决特定问题的密度/“约束度”通常低于阈值,在该阈值下,解决方案的存在概率从1变为0 Whp引起了广泛关注。
JWM

“容易溶解”的门槛是多少(大致而言)?是更像0.2还是更像0.001?
dimpol

1
@dimpol通常没有定义这样的精确阈值。问题的关键在于输入大小的概率变为“ 0”或“ 1”。一个典型的声明将是“算法的解决了与随机3-SAT实例变量和Δ Ñ至少与概率子句p Ñ,其中p Ñ变为1与Ñ ”。该阈值是值Δ的量,从概率抚育变为0到趋向于1nΔnpnpnnΔ
Sasho尼科洛夫

认为这些想法总体上很有影响力,与此主题相关的论文非常多,并且研究仍在继续。但是,它是一个跨领域的概念,因为相变更多地是来自于物理,并且(也许是MATs回答以下问题)计算机科学家可能对其意义持怀疑态度,而且似乎更像是经验/实验概念。如果其他人对此评论表示同意,则可能会尝试在某个点上解决问题,但目前,邀请/定义强烈鼓励在理论计算机科学聊天室中
vzn

1
另请参阅NP完全问题中相变的普遍性。还认为Walsh 1998 的约束刀刃很重要,并且尚未进行太多跟进,它与过渡点相关,但可能不完全相同...本文没有直接提及分形,但认为它在暗示方面很有启发性。自相似性,尺度不变性等
vzn

Answers:


26

这是状态的粗略总结,基于Vardi在有限模型和算法模型理论研讨会(2012)上的演讲:

据观察,硬实例位于从欠约束区域到过度约束区域的相变。基本的推测是,相变与NP问题的计算复杂性之间存在紧密的联系。

Achlioptas–Coja-Oghlan发现,在满足区域中存在一个密度,在该区域中,解决方案空间破碎成指数地成许多小簇。Vinay Deolalikar进行了著名的证明尝试,其假设是粉碎意味着计算难度。XOR-SAT在P中的事实反驳了Deolalikar的证明PñPP并且粉碎。因此,粉碎不能用来证明计算的硬度。

当前的主流思想似乎是(如Vardi所述),相变与计算复杂性并没有内在联系。

最后,这是《自然》杂志上发表的一篇文章,研究了相变与K-SAT的计算硬度之间的联系。


感谢您的概述,可惜这并没有带来任何真正的突破。
dimpol

1
我认为可以认为粉碎现象可以排除一类基于局部搜索的算法,这些算法是许多针对NP难题的启发式算法的基础。
卡夫

3
Vardi的类似/稍作修订的演讲/视频,2014年,相变和计算复杂度,班夫国际研究站
vzn

@vzn尼斯,必须观看Vardi的视频。
Mohammad Al-Turkistany

14

是的,自Cheeseman,Kanefsky和Taylor的1991年论文以来,已经做了很多工作。

搜索NP-Complete问题的相变将为您带来很多结果。Hartmann和Weigt [1]就是这样的评论。有关更高级别的介绍,请参见Brian Hayes美国科学家的文章[2] [3]。

Cheesemen,Kanefsky和Taylor的1991年论文是计算机科学家没有注意数学文献的不幸案例。在Cheeseman,Kanefsky和Taylor的论文中,他们将汉密尔顿周期确定为具有相变,并且搜索成本在临界阈值附近有所上升。他们使用的随机图模型是Erdos-Renyi随机图(固定边缘概率或等效的高斯度分布)。在Cheeseman等人1991年的论文之前,已经对该案例进行了充分的研究,即使对于临界图或接近临界阈值,此类图也几乎可以肯定地采用多项式时间算法。Bollobas的“随机图” [4]是很好的参考。我相信原始证据是由Angliun和Valiant [5]提出的,而Bollobas,Fenner和Frieze [6]则作了进一步的改进。继芝士曼之后

随机Erdos-Renyi随机图中汉密尔顿周期的相变存在的意义是,找到解决方案的可能性有快速的转变,但这并不意味着汉密尔顿周期的“内在”复杂性增加。在理论上和实践上,甚至在临界转变时,几乎肯定有多项式时间算法可以在鄂尔多斯-仁伊随机图中找到哈密顿环。

调查传播[8]在找到非常接近临界阈值的随机3-SAT令人满意的实例方面取得了成功。我目前的知识有点生锈,所以我不确定在临界阈值附近为不满意的情况找到“有效”算法是否有很大进展。据我所知,3-SAT是一种“容易”解决的问题,它是否可以满足且接近临界阈值,但在临界阈值附近无法满足的情况下未知(或很难?)。

我的知识现在已经过时了,但是上一次我深入研究这个主题时,有一些事情对我很重要:

  • 对于Erdos-Renyi随机图,哈密顿周期是“容易的”。困难之处在哪里?
  • 当在几乎确定的概率0或1区域中很远时,即使对于中等大小的实例(据我所知,每个1000位500位数字都是完全难解的),没有有效的算法(据我所知),数字分区应该可以解决。最先进的算法)。[9] [10]
  • 对于接近临界阈值的可满足实例,即使是巨大的实例大小(数百万个变量),3-SAT都很“容易”,但是对于接近临界阈值的不满意实例,3-SAT很难。

我犹豫将其包括在这里,因为我没有发表任何同行评审的论文,但我确实写了论文就此主题而言。主要思想是,“本质上困难”的一类可能的随机合奏(哈密顿循环,数字分配问题等)具有“尺度不变性”。稳定征值分布是具有这种质量的自然分布中的一种,具有幂律尾部,并且可以从NP-完全合奏中选择随机实例,该组合以某种方式并入了稳定征值分布。我给出了一些薄弱的证据,如果选择具有Levy稳定度分布而不是正态分布(即Erdos-Renyi)的随机图,则可以发现本质上困难的哈密顿循环实例。如果没有别的,它至少会为您提供一些文献综述的起点。

[1] AK Hartmann和M. Weigt。组合优化问题中的相变:基础知识,算法和统计力学。Wiley-VCH,2005年。

[2] B.海斯。最简单的难题。美国科学家,90(2),2002。

[3] B.海斯。在门槛上。美国科学家,91(1),2003。

[4] B.Bollobás。随机图,第二版。剑桥大学出版社,纽约,2001年。

[5] D. Angluin和LG Valiant。用于汉密尔顿电路和匹配的快速概率算法。J.计算机,系统。Sci。,1979:18:155-193。

[6] B.Bollobás,TI Fenner和AM Frieze。在随机图中查找汉密尔顿路径和循环的算法。Combinatorica,7:327-341,1987。

[7] B. Vandegriend和J. Culberson。对于哈密顿环问题,G n,m相变并不困难。J. AI Research,9:219-245,1998。

[8] A. Braunstein,M。Mézard和R. Zecchina。调查传播:可满足性的算法。随机结构和算法,27:201-226,2005年。

[9] I. Gent和T. Walsh。数划分的启发式分析。计算智能,1998年14:430-451。

[10] CP Schnorr和M. Euchner。格基减少:改进的实用算法和解决子集和的问题。L. Budach编辑的《计算理论基础》 91年论文集,计算机科学讲义,第529卷,第68-85页,1991年。


0

25年的学习,以及目前的想法在哪里?

+++理念1:

根据我在可满足性解决方案方面的经验,我在实践中发现,在要尝试解决的公式中添加有效的k子句类似于确定(nk)变量qbf。

这似乎是一种显示当前NP的饱和求解方法是pspace-hard的方法!

+++理念2:

另一个想法是,AllQBFs问题是布尔层次结构中的实际问题。AllQBFs问题是:产生一个布尔表达式Q,它决定公式R的所有2 ^ n个qbfs。当原始公式R为单调或2-cnf时,AllQBF很容易。

由于Q通常是指数的,因此所有QBF似乎是显示QBF为Exp的一条合理的途径,因此评估Q的赋值(原始公式R的量化)是指数的。因此,证明NP的道路是Exp至少其中有两块砖。

+++理念3:常规k-cnfs

顺便说一句,所有相变研究都错过了正则k-cnfs,​​其中变量(在任一方向上)的出现次数是固定的,类似于度数正则图...正则k-cnfs比标准模型难得多,因为所有变量在约束方面看起来都是相同的。

二十五年前,在读了cheeseman之后,我专注于度正则图着色,因为所有变量看起来都一样。因此,我将在这里滥用我的回答权限,并在规则图上显示25年的结果!

+++理念4:可满足性基准研究的黄金点

我已经相当广泛地研究了D正则N顶点图的C着色。下表总结了常规图形着色的Golden Point结果。

对于高概率,可满足N个随机实例。对于非常高,N ^ 2是可满足的。对于超高,N ^ 3个随机实例是可以满足的。

高概率(1-1-N)金色着色点是:

C3D5N180 C4D6N18 C4D7N35 C4D8N60 C4D9N180?C5D10N25 C5D11N42 C5D12N72

极高概率(1-1-((N ^ 2))金色着色点是:

C3D5N230?C4D6N18 C4D7N36 C4D8N68 C4D9N ??? C5D10N32 C5D11N50 C5D12N78

超高概率(1-1 /(N ^ 3))金色着色点是:

C3D5N ??? C4D6N22 C4D7N58 C4D8N72?C4D9N ??? C5D10N38 C5D11N58 C5D12N ??

C4D9条目表示第九个度图的四种颜色。这些是我在25年的卫星求解中遇到的最困难的随机4cnfs。我最近在十天的CPU时间后为172顶点第九度图形着色。

+++想法5:C5D16N ???? 稍微推测金点已经存在。

谢谢,Daniel Pehoushek


4
这不是展示未发表研究的正确地方。撰写一篇详细解释所有内容的论文,将其放在arxiv或其他地方,并在此处发布带有摘要的链接。
Sasho Nikolov

根据问题标题,C4D9正则图着色点是一个极端的难题。它需要一些上下文,因此需要该表的其余部分。
丹尼尔·皮侯什克
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.