分布式系统中主要的未解决问题?


23

受此问题的启发,在(理论上的)分布式系统领域需要改进的主要问题和解决方案是什么?

会员协议,数据一致性之类的东西?

Answers:



14

许多图形问题分布式时间复杂度仍然是一个悬而未决的问题。

一般而言,分布式图算法是一个我们希望在其中(至少渐近地)匹配图问题的分布式时间复杂度的上限和下限的领域。例如,对于许多优化问题,紧密边界是已知的。但是,仍然有很多经典的打破对称性的问题尚不清楚。

Δ+12Δ1Δ

O(Δ+logn)nO(Δ)+o(logn)o(Δ)+O(logn)回合。通常,我们不了解运行时间如何取决于最大程度,这就是我所说的局部协调问题

nΔ


上面,我集中讨论了分布式计算特有的问题。分布图算法中也存在一些开放性问题,这些问题与一般理论计算机科学中的开放性问题有着非凡的联系。例如,拥塞集团模型的非恒定下界是分布式计算中的一个大问题。最近发现,这样的下限也意味着ACC的新下限。


7

关于“最小生成树(MST)的分布式算法”的未解决问题:(在[1]中列出)

  1. 关于时间复杂度

    近时最佳算法和下限出现在本文的[2]和参考文献中。最佳时间复杂度仍然是一个未解决的问题。

  2. 关于邮件的复杂性,

    O(m+nlogn)

  3. 关于同步模型:

    O(loglogn)

O(logn)


[1] Sergio Rajsbaum在“算法大全”(2008年)中发布了最小生成树的分布式算法

[2] Lotker等人的恒定直径图分布式MST。分发。计算,2006年。

O(loglogn)

[4] Khan等人的最小生成树的快速分布式近似算法。光盘2006。


3
O(logloglogn)

4

另请参阅(最近)由Notre Dame研究人员Douglas Thain主持的幻灯片演示 “分布式计算中的未解决的计算机科学问题”(2012年),他领导了他们的合作计算实验室。它具有更多的应用倾向,但所列出的关键问题不可避免地导致了理论领域的发展。

  • Kiloscale问题:具有足够并发性的任何工作流都应该能够在没有sysadmin帮助的情况下,首次且每次都可以在1K内核上正确运行。

  • 暂停问题:给定工作流在1000个节点上运行,使其完全确定并停止清理所有关联状态。

  • 依赖问题:

    (1)给定一个程序,找出在另一台计算机上运行所需的一切。

    (2)给定一个进程,找出它在运行时实际使用的(分布式)资源。

    (3)将1和2扩展到整个工作流程。

  • 正确调整大小的问题:给定(结构化)应用程序和给定群集,云或网格,请选择能够以可接受的成本获得良好性能的资源分配。

  • 故障排除问题:在100层软件堆栈的中间发生故障时,如何以及何时报告/重试/忽略/抑制错误?

  • 设计问题:应如何设计应用程序,使其适合分布式计算?

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.