Answers:
分散式数据仓库本质上是由各个地区或业务部门维护但可以集中使用的数据仓库的集合。它们可以位于同一台物理服务器上,可以共享报告工具,也可以通过其他方式在整个组织中使用。也可能有集中的组件,例如主数据管理。通常这样做是因为集中式数据仓库在超出一定规模的组织机构之后变得笨拙。数据仓库必须对更改做出响应,如果响应太迟,则各个部门将开始构建自己的解决方案。
您可以在投资银行中看到这种情况,在这种情况下,趋势是建立数据仓库以满足特定要求(例如特定的监管计划或某种类型的财务报告),而不是在整个业务范围内建立集中式仓库。一家大型银行的公司太复杂了,以至于无法在合理的时间内完成完全集中的EDW的要求。
联邦数据仓库跨分散的数据仓库添加了一个主合并层。通常,这仅会容纳狭窄的垂直数据切片,因为其目的是合并整个业务中的关键指标以进行公司或组级别的报告,而不是为所有部门提供通用的MI平台。这些部门可以自行创建EDW或MI系统,但需要提供填充中央合并层所需的数据集。
这种架构为您提供了两全其美的优势。中央管理人员可以查看整个组织的指标,部门可以安排MI解决方案以满足他们的需求。中央管理只需将其分析和MI所需的数据要求作为部门系统提供的提要即可。如果他们需要在特定部门上进行更深入的报告或分析,则可以由部门系统提供。
下面链接的文章更深入地讨论了联合数据仓库。
http://www.zentut.com/data-warehouse/federated-data-warehouse-architecture/
本文将更深入地讨论数据仓库拓扑。
https://www.ibmbigdatahub.com/blog/data-warehouse-architectures-multinational-organizations-part-1
https://www.ibmbigdatahub.com/blog/data-warehouse-architectures-multinational-organizations-part-2