Answers:
分布式数据库的理论和实践都有很多研究领域。
主要的实际挑战之一是为分布式和地理复制数据库实现有效的并发控制机制。为了有效地执行事务,这种机制提供的可比性比可串行性要弱,这要求事务似乎要顺序执行。串行性的替代方法是建立快照隔离[1],但是事实证明,这种方法很难扩展到地理复制和分布式系统。当前,快照隔离(SI)定义了两种不同的变体来处理地理复制系统中的并发控制:并行快照隔离(PSI)[2]和非单调快照隔离(NMSI)[ 3,4]。至于涉及分布式数据库的问题(即数据在不同站点之间的分片),
隔离级别的概念不同,它们提供的保证比可序列化性要弱,另一个重要的问题是,编写程序的方式应使执行看起来仍然是可序列化的。快照隔离的合理标准已经在[1]中提出。我们小组中的某些人目前正在为PSI设计合理的标准。
从理论和实践的角度来看,另一个相关的问题是事务斩波。基本上,斩波是一种静态分析技术,其中粗粒度的事务被分解为较小的细粒度的事务。对于可串行性,此问题已在[6]中得到解决,结果理论已在[7]中得到了实际应用。
从分布式数据库的理论基础的观点来看,有人建议使用弱存储模型社区[8]中的技术来正式定义事务的行为。在[9]中,作者给出了交易行为的正式概念。[10]中使用了相同的方法来指定复制数据类型的行为。
最近,我和我的一些同事(Alexey Gotsman和Hongseok Yang)从[8,9,10]中开发的技术开始构建了一个用于指定地理复制数据库的一致性级别的可观察行为的理论框架。我们成功地采用了该框架,对SI,PSI和NMSI进行了公理化处理,对于简单的实现,我们已证明每种方法都是正确的。我们还利用由此产生的理论来设计PSI的斩波标准。这些结果有望在可预见的将来发布。
如果您有其他问题,请随时给我写信。希望这可以帮助,
安德里亚·塞隆(Andrea Cerone)。
参考文献:
[1] Fekete等人,“使快照隔离可序列化”(2005)
[2] Sovran等人,地理复制系统的事务存储(2011年)
[3] Arkedani等人,《非单调快照隔离:地理复制事务系统的可扩展性和强一致性(2013年)
[4] Arkedani等人,《快照隔离的可伸缩性》(2013)
[5] Binnig等人,分布式快照隔离:全球交易在全球范围内支付,本地交易在本地范围内支付
[6] Shasha等人,交易切入:算法和性能研究(1995)
[7] Zhang等,事务链:在地理分布式存储系统中以低延迟实现可序列化(2013年)
[8] Alglave,弱记忆模型的正式层次结构(2012)
[9] Buckhardt等人,《理解最终一致性》(2013年)
[10] Buckhardt等人,《复制数据类型:规范,验证,最优性》(2014年)