3
数据仓库设计:组合的日期时间维度与单独的日期和时间维度和时区
我们刚刚开始为新的数据仓库设计,我们正在尝试设计日期和时间维度的工作方式。我们需要能够支持多个时区(可能至少是GMT,IST,PST和EST)。最初,我们以为我们可以将日期时间维度的组合范围缩小到15分钟左右,这样一来,事实表中就有一个键,而所有受支持时区的所有不同日期时间数据都在一个维度表中。(即日期键,GMT日期,GMT时间,IST日期,IST时间等) Kimball建议将日期维度与日期时间维度分开,以防止表格过大(数据仓库工具包第240页),听起来不错,但这意味着我们在每个时区的事实表中都有两个键我们需要支持(一个代表日期,另一个代表一天中的时间)。 由于我在这方面经验不足,所以我希望有人知道两种方法之间的权衡,即性能与所有不同时区密钥的管理。也许还有其他方法,我已经看到有人谈论每个时区在事实表中有单独的行,但是如果您的事实表有数百万行,那么您需要将其四倍以添加时区,这似乎是一个问题。 如果我们进行15分钟的粒化,那么我们的日期时间维度表中每年将有131,400(24 * 15 * 365)行,这听起来听起来并不可怕,但是直到我们测试了一些之后,我们才能确定原型查询。在事实表中具有单独的时区键的另一个问题是查询必须根据所需的时区将维度表连接到其他列,也许这是SSAS为您解决的事情,我不确定。 感谢您的任何想法,-Matt