Answers:
在http://arxiv.org/abs/1101.1902的第2节中,作者定义了MapReduce模型,该模型有意像BSP一样进行结构化。他们也证明了模拟定理。可能是一个不错的起点。
是的,我的观点是经典MapReduce是BSP模型(因此,它对可实现的最大并行性能具有固有的局限性)。但是,有关MapReduce的最新工作似乎集中在较宽松的同步概念上,这将使这种“通用MapReduce”脱离严格的BSP框架。特别是,如果复制一些数据,则可以放宽同步结构,从而获得性能提升。
例如,请参见Foto Afrati和Jeff Ullman的著作:EDBT 2010 在地图缩小环境中优化连接。(预印本)