分布式交易中的主要研究问题是什么?


10

背景:事务处理一直是数据库理论中的传统研究主题。如今,分布式事务已被通常涉及数据分区(也称为分片)和数据复制的大规模分布式存储系统普及。

分布式交易中的主要研究问题是什么?

是否存在需要(理论上)改进的众所周知的理论和解决方案?

任何参考表示赞赏。

Answers:


9

分布式数据库的理论和实践都有很多研究领域。

主要的实际挑战之一是为分布式和地理复制数据库实现有效的并发控制机制。为了有效地执行事务,这种机制提供的可比性比可串行性要弱,这要求事务似乎要顺序执行。串行性的替代方法是建立快照隔离[1],但是事实证明,这种方法很难扩展到地理复制和分布式系统。当前,快照隔离(SI)定义了两种不同的变体来处理地理复制系统中的并发控制:并行快照隔离(PSI)[2]和非单调快照隔离(NMSI)[ 3,4]。至于涉及分布式数据库的问题(即数据在不同站点之间的分片),

隔离级别的概念不同,它们提供的保证比可序列化性要弱,另一个重要的问题是,编写程序的方式应使执行看起来仍然是可序列化的。快照隔离的合理标准已经在[1]中提出。我们小组中的某些人目前正在为PSI设计合理的标准。

从理论和实践的角度来看,另一个相关的问题是事务斩波。基本上,斩波是一种静态分析技术,其中粗粒度的事务被分解为较小的细粒度的事务。对于可串行性,此问题已在[6]中得到解决,结果理论已在[7]中得到了实际应用。

从分布式数据库的理论基础的观点来看,有人建议使用弱存储模型社区[8]中的技术来正式定义事务的行为。在[9]中,作者给出了交易行为的正式概念。[10]中使用了相同的方法来指定复制数据类型的行为。

最近,我和我的一些同事(Alexey Gotsman和Hongseok Yang)从[8,9,10]中开发的技术开始构建了一个用于指定地理复制数据库的一致性级别的可观察行为的理论框架。我们成功地采用了该框架,对SI,PSI和NMSI进行了公理化处理,对于简单的实现,我们已证明每种方法都是正确的。我们还利用由此产生的理论来设计PSI的斩波标准。这些结果有望在可预见的将来发布。

如果您有其他问题,请随时给我写信。希望这可以帮助,

安德里亚·塞隆(Andrea Cerone)。

参考文献:

[1] Fekete等人,“使快照隔离可序列化”(2005)

[2] Sovran等人,地理复制系统的事务存储(2011年)

[3] Arkedani等人,《非单调快照隔离:地理复制事务系统的可扩展性和强一致性(2013年)

[4] Arkedani等人,《快照隔离的可伸缩性》(2013)

[5] Binnig等人,分布式快照隔离:全球交易在全球范围内支付,本地交易在本地范围内支付

[6] Shasha等人,交易切入:算法和性能研究(1995)

[7] Zhang等,事务链:在地理分布式存储系统中以低延迟实现可序列化(2013年)

[8] Alglave,弱记忆模型的正式层次结构(2012)

[9] Buckhardt等人,《理解最终一致性》(2013年)

[10] Buckhardt等人,《复制数据类型:规范,验证,最优性》(2014年)


感谢您的全面答复。对于SI,在文献中的复制设置中是否存在分布式的无锁协议?还是因为SI的伸缩性不好,这种尝试没有意义吗?对于PSI,我已阅读了一篇论文(Tim Kraska @ Eurosys'13),其中提到了其在未来工作中的实施。是广义的Paxos适合呢?与Sovran等[2]中的原始优点/缺点/挑战相比,有哪些可能的利弊?再次感谢。
恒新2014年

2
实际上,SI不能很好地扩展到地理复制系统。在上面的[4]中,作者证明存在某些属性,例如正版部分复制,这些属性无法通过以SI一致性级别运行的地理复制DBMS来实现。在[5]中,作者展示了一些示例,这些示例根据SI(在单个分片上)而不是全局(而不是全局)执行,并提出了SI的一种变体,称为DSI。对于涉及MDCC的问题,我不了解本文,我不得不承认我不知道广义Paxos的实现细节。但我很乐意看看,并尽快答复。
Andrea Cerone 2014年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.