是的,如果您愿意为实现和维护数据而做的工作,则对数据标准化有很大的好处。标准化的两个基本好处是:
标准化的简单方法是为每个人,地方,事物,概念或事件创建一个表。这样,您就可以在数据库中的一个位置中拥有您感兴趣的每个人,地方,事物,概念或事件的每个特征。插入和更新数据时,可以实现数据完整性的好处。由于已规范化,因此在数据库中的许多地方都没有具有相同特征的冗余副本,每个副本都有不同的值,因此您必须记住要进行更新并保持同步。其次,在插入或更新数据以确保数据有效时,数据库中只有一个地方可以进行程序检查。由于您的数据来自许多excel电子表格,标准化数据使您有机会对负载执行数据完整性检查,以确保您的分析基于准确的数据。当您要读取和分析数据时,可以获得查询灵活性的好处。由于您已经对数据进行了标准化,因此可以基于有关要回答的数据的问题(包括仅包括您需要回答的特定问题)以灵活的方式连接表。其次,这使数据库能够比对非标准化表中的所有数据(包括与问题无关的数据)进行扫描的速度更快地返回问题的答案。由于您已经对数据进行了标准化,因此可以基于有关要回答的数据的问题(包括仅包括您需要回答的特定问题)以灵活的方式连接表。其次,这使数据库能够比对非标准化表中的所有数据(包括与问题无关的数据)进行扫描的速度更快地返回问题的答案。由于您已经对数据进行了标准化,因此可以基于有关要回答的数据的问题(包括仅包括您需要回答的特定问题)以灵活的方式连接表。其次,这使数据库能够比对非标准化表中的所有数据(包括与问题无关的数据)进行扫描的速度更快地返回问题的答案。
Access是一种简化的DBMS,它包括一个基本的SQL处理器,该处理器使您可以编写查询,从而利用规范化数据的优势。如果您最终要使用功能齐全的DBMS SQL Server,那么现在对数据进行规范化将简化转换过程,并让您充分利用SQL Server的全部功能及其非常丰富的SQL实现。
正如我在开始时提到的,要获得这些好处,您必须愿意进行前期编程,以转换来自各种excel转储的数据,并将这些电子表格中的行和列映射到规范化表。这不是简单的练习,但是可以使用Access编程来完成。一种方法是创建表,该表复制源中的数据并将数据加载到表中。这些被称为阶段表。一旦在Access表中具有未标准化的数据,您就可以更轻松地使用SQL编写访问代码,以从那些阶段表中提取数据,对其进行规范化,确定数据质量问题(例如,在两个不同的excel转储中应该具有相同的特征)值相同但不相同),然后将其加载到规范化表中。这是用于标准化来自非标准化源的数据的常用方法,该标准化源在基于主题区域的数据仓库中非常常见。
尽管访问数据库中有高质量,标准化的数据,但您会发现这样做值得付出额外的努力。当您向消费者展示数据质量很差的示例时,您会发现消费者将看到您是一名真正的数据专业人员,并且发现了这一事实,因此可以在源中对其进行更正。同样,当他们要求提供一种以非常不同的方式分析数据的新报表时,您可以使用SQL快速创建新报表,从而以一种原本无法预期的完全不同的方式将规范化表中的数据合并。他们将给您留下深刻的印象,您能够快速,轻松地做到这一点!
我希望这有助于解释为什么标准化对您有好处。