Answers:
请查看此以获取更多信息。
从上一个链接:
数据库
数据仓库
同样重要的是要注意,数据仓库的来源可以从零到许多数据库。
从非技术角度:数据库仅限于特定的应用程序或一组应用程序。
数据仓库是企业级数据存储库。它将包含业务的所有/许多部门的数据。它将共享此信息以提供业务的全局图。对于业务不同部门之间的集成而言,这也至关重要。
从技术角度来看:未给“数据仓库”一词提供公认的定义。我个人将数据仓库定义为数据集市的集合。每个数据集市由一个或多个数据库组成,其中该数据库特定于特定问题集(应用程序,数据集或过程)。
简单地说,数据库是数据仓库的组成部分。有很多地方可以探讨这个概念,但是由于没有“定义”,因此您在回答任何问题时都会发现挑战。
数据库:-OLTP(在线交易过程)
数据仓库
数据仓库与数据库:数据仓库是专门为数据分析而设计的,它涉及读取大量数据以了解数据之间的关系和趋势。数据库用于捕获和存储数据,例如记录交易的详细信息。
数据仓库:合适的工作负载 -分析,报告,大数据。 数据源 -从许多来源收集并标准化的数据。 数据捕获 -通常按预定的批处理计划进行批量写入操作。 数据规范化 -非规范化的架构,例如Star架构或Snowflake架构。 数据存储 -为简化访问和高速查询而优化。使用柱状存储的性能。 数据访问 -优化以最小化I / O和最大化数据吞吐量。
事务性数据库:合适的工作负载 -事务处理。 数据源 -从单个源(例如事务系统)直接捕获的数据。 数据捕获 -针对连续写入操作进行了优化,因为可以使用新数据来最大化事务吞吐量。 数据标准化 -高度标准化的静态架构。 数据存储 -针对单个面向行的物理块的高写入操作进行了优化。 数据访问 -大量的小型读取操作。
数据仓库(DW)是用于收集和管理来自各种来源的数据以提供有意义的业务见解的过程。数据仓库通常用于连接和分析来自异构源的业务数据。数据仓库是构建用于数据分析和报告的BI系统的核心。
数据仓库的源可以是数据库的群集,因为数据库用于在线事务处理,例如保留当前记录。.但是在数据仓库中,它存储用于在线分析过程的历史数据。
数据仓库是通常存储在数据库中的一种数据结构。数据仓库指的是数据模型以及存储在其中的数据类型-建模后的数据(数据模型)用于服务器以进行分析。
数据库可以归类为容纳数据的任何结构。传统上,这将是RDBMS,例如Oracle,SQL Server或MySQL。但是,数据库也可以是NoSQL数据库(例如Apache Cassandra)或列式MPP(例如AWS RedShift)。
您会看到数据库只是存储数据的地方。数据仓库是一种特定的数据存储方式,具有特定的用途,即为分析查询提供服务。
OLTP与OLAP并不能告诉您DW和数据库之间的区别,OLTP和OLAP都驻留在数据库中。它们只是以不同的方式(不同的数据模型方法)存储数据,并用于不同的目的(OLTP-记录事务,针对更新进行了优化; OLAP-分析信息,针对读取进行了优化)。