联合数据仓库和分散数据仓库有什么区别？

我找不到任何明确的定义或解释。两者似乎都是分散的。似乎在联邦DWH中，数据是分布式的，没有集成到单个存储库中，而是可以从分布式源访问的。

在分散DWH实施中，数据被集成到一个中央存储库中。

请解释这两种实现之间的区别。

data-warehouse terminology distributed-databases

— 生命水
source

svenvanleuken.com/...

— Shiwangini Shishulkar

分散式数据仓库本质上是由各个地区或业务部门维护但可以集中使用的数据仓库的集合。它们可以位于同一台物理服务器上，可以共享报告工具，也可以通过其他方式在整个组织中使用。也可能有集中的组件，例如主数据管理。通常这样做是因为集中式数据仓库在超出一定规模的组织机构之后变得笨拙。数据仓库必须对更改做出响应，如果响应太迟，则各个部门将开始构建自己的解决方案。

您可以在投资银行中看到这种情况，在这种情况下，趋势是建立数据仓库以满足特定要求（例如特定的监管计划或某种类型的财务报告），而不是在整个业务范围内建立集中式仓库。一家大型银行的公司太复杂了，以至于无法在合理的时间内完成完全集中的EDW的要求。

联邦数据仓库跨分散的数据仓库添加了一个主合并层。通常，这仅会容纳狭窄的垂直数据切片，因为其目的是合并整个业务中的关键指标以进行公司或组级别的报告，而不是为所有部门提供通用的MI平台。这些部门可以自行创建EDW或MI系统，但需要提供填充中央合并层所需的数据集。

这种架构为您提供了两全其美的优势。中央管理人员可以查看整个组织的指标，部门可以安排MI解决方案以满足他们的需求。中央管理只需将其分析和MI所需的数据要求作为部门系统提供的提要即可。如果他们需要在特定部门上进行更深入的报告或分析，则可以由部门系统提供。

下面链接的文章更深入地讨论了联合数据仓库。

http://www.zentut.com/data-warehouse/federated-data-warehouse-architecture/

本文将更深入地讨论数据仓库拓扑。

https://www.ibmbigdatahub.com/blog/data-warehouse-architectures-multinational-organizations-part-1

https://www.ibmbigdatahub.com/blog/data-warehouse-architectures-multinational-organizations-part-2

— 关注TunbridgeWells
source

因此，它们都是分散的，但是联合将一个子集（关键指标）集成到一个地方？

— LifeH2O

是。没错请记住，这些定义是非常非正式的，因此人们可能会以不同的方式使用它们。尽管我曾经提出过一个关于联合体系结构的建议，但我从未见过构建这两种类型的系统的机会，而且我已经看到几个站点的系统可以根据我使用的定义进行分散。

— ConcernedOfTunbridgeWells