我是新手,试图绕过OLAP,但我有几个问题。
- 问题1: OLAP多维数据集可以存储中位数,众数,百分位数吗?
- 问题2:用户编写的MDX查询能否返回行级数据的摘要?(例如:%交易> $ 100美元)。还是多维数据集设计者必须将此添加到多维数据集?
- 问题3:现在有没有OLAP产品提供访问行级数据的机制?哪一个?
我们的IT部门正在寻找有关特定MS Analsis Services ROLAP多维数据集所遇到的问题的反馈。我们无权访问其背后的关系数据库,并且需要执行多维数据集中当前不可用的计算。
让我看看我是否拥有这项权利。
- 多维数据集可以提供计数,均值,比例,标准差的统计信息。
- 如果没有通过多维数据集设计器提供的度量来满足特定的统计信息,我们可以编写MDX查询来获取它吗?还是他们需要更改多维数据集以便从行级数据进行预先计算?
- 多维数据集无法提供诸如中位数,众数或百分位数之类的统计信息,因为这些统计信息无法正确聚集。
他说,我正在阅读利兰·威尔金森(Leland Wilkinson)的《图形语法》及其有关数据挖掘和OLAP的章节。
这些[多维数据集运算]可以很好地处理统计数据,例如计数,均值,比例和标准偏差。可以通过对和,平方和和其他项进行运算来计算子类上的简单聚合,这些和在线性函数中组合以产生基本的汇总统计信息。
它们不适用于中位数,众数和百分位数之类的统计信息,因为这些统计信息的总和不是其总和的统计信息。例如,中位数不是聚合的中位数。
他继续补充:
但是,最近出现了一个更复杂的ROLAP模型。通过多种技术,可以使统计算法通过关系模型实时访问原始数据。这种方法比诸如数据多维数据集之类的结构提供的刚性聚合更有希望。
在此体系结构最优雅的形式中,应用程序可以请求远程连接以提供有关其数据处理方法的信息,并根据返回的信息采取适当的措施。以这种形式,组件体系结构可以实现分布式计算的真正希望:独立于站点,操作系统或语言的设计和执行。
那是在2005年左右写的。有人知道采用这种方法的产品可以进行行级数据访问吗?