我一直在研究Amazon的Redshift数据库,以作为将来替换我们的数据仓库的可能。我的经验一直是使用维度建模和Ralph Kimball的方法,因此看到Redshift不支持自动递增列的串行数据类型等功能有点奇怪。
但是,AWS Big Data博客最近有一篇博客文章,介绍如何针对星型架构优化Redshift:https : //blogs.aws.amazon.com/bigdata/post/Tx1WZP38ERPGK5K/Optimizing-for-Star-Schemas和交错排序在Amazon Redshift上
我的问题是在Redshift中加载星型架构的最佳实践是什么?我在Redshift的任何文档中都找不到答案。
我倾向于将文件从S3导入到临时表中,然后在插入目标表之前使用SQL进行诸如查找和生成代理键之类的转换。
这是别人目前在做什么吗?有没有值得花这笔钱的ETL工具来简化这一过程?