分布式计算模型中的处理器故障主要有两种类型:
(1)崩溃失败:处理器停止运行,再也不会启动。(2)拜占庭式故障:处理器恶意地进行对抗。
我的问题是:
已经研究了哪些其他类型的处理器故障,这些故障不会减少到崩溃或拜占庭式故障?
另外,还有一个更具体的问题:
是否已研究过某个模型,该模型有可能在时间步处开启流程,而在其他时候关闭?因此,每个过程都照常眨眼。
我对这些失败与共识和其他分布式协议问题之间的关系最感兴趣。
谢谢。
分布式计算模型中的处理器故障主要有两种类型:
(1)崩溃失败:处理器停止运行,再也不会启动。(2)拜占庭式故障:处理器恶意地进行对抗。
我的问题是:
已经研究了哪些其他类型的处理器故障,这些故障不会减少到崩溃或拜占庭式故障?
另外,还有一个更具体的问题:
是否已研究过某个模型,该模型有可能在时间步处开启流程,而在其他时候关闭?因此,每个过程都照常眨眼。
我对这些失败与共识和其他分布式协议问题之间的关系最感兴趣。
谢谢。
Answers:
由于与拜占庭式容错有关的资源成本很高,因此当然已经分析了具有越来越强假设的故障模型,尤其是针对容忍受限类型的故障的资源需求。(Azadmanesh和Kieckhafer,2002年)提供了非常好的分类法(见图1)。
对故障模式假设进行建模的另一种方法是,从节点中心的观点出发,即将消息丢失建模为发件人的错误,转而使用链接错误模型,该模型只是双重视图,一旦它们可能导致不一致。该系统被考虑。(Schmid,Weiss,and Rushby,2002)研究了该模型,规避了(Grey,1978)的不可能结果,该结果显示了链路故障下协调攻击问题的确定性解决方案。
关于已经提到的遗漏失效模型,请查看NeigerToueg,其中考虑了不同的模型。
是否研究过某个模型,该模型有可能在时间步长t处打开某个过程,而在某个时间步长处关闭?因此,每个过程都像过去一样闪烁。
这听起来像是崩溃恢复模型。我不知道任何模型可能会打开/关闭进程。还有一些变体,其中进程在一段时间内处于拜占庭状态,然后恢复,随着时间的推移,所有进程都可以成为拜占庭状态(不过,大多数情况下考虑进行时钟同步)。
请注意,如果关闭状态只是表示一个进程没有进展(它不会失去其状态,并且不会由于接收器处于“关闭”状态而导致消息丢失),那么您所看到的就是异步的系统。在共享内存的情况下,您的问题可能与此Aspnes论文紧密相关。
可能还有其他类型的故障。例如,某些处理器(例如,在广播或多播协议下)可能变得过载,并且将无法处理所有传入消息。这导致该处理器对于分布式系统中的某些处理器显得脱机。