记录用于迁移的数据库映射的最佳方法


9

我正在一个项目中,该项目包括用于迁移的映射数据库元素,我想知道其他人正在使用哪些工具来执行此操作?

Excel是记录简单映射的一种非常灵活的方式,但是我想知道是否有人遵循他们所遵循的特定方法论或推荐使用的其他工具?


Answers:


2

执行此Excel的最常见方法是,它需要权衡取舍:

  • 如果迁移的任何一方发生更改(由于缺少某些内容,某些更改等),更新电子表格都非常困难。
  • 人们很难使用Excel来实现其中记录的规则。
  • 如果您有多个人在文档上进行协作,则几乎不可能进行更改跟踪。

我更喜欢使用数据建模工具(例如ER / Studio,ERwin或PowerDesigner)的数据沿袭功能来跟踪从一个数据存储迁移到另一个数据存储所需的转换。我获得了RE的所有好处,并与来源和目标进行了比较,而且没有上述任何权衡。确实有所作为。


1

如果您要记录数据映射,那么电子表格可能是最简单的方法,尽管它除了适用于1:1映射之外,对其他任何东西都不适用。一些方法是:

Excel:您可以使用电子表格进行映射,尤其是在简单的情况下。如果您的数据库不是同构的(即它们没有针对您感兴趣的所有字段进行1:1映射),则记录该映射可能会更加复杂。如果差异很小,您仍然可以通过在映射更复杂的字段中添加注释来在电子表格中对此进行记录。

具有自定义元模型的CASE工具一两年前,我为Sparx Enterprise Architect构建了扩展元模型和一些相关脚本。这使我能够设置映射的图形表示形式,并且它具有一些建模原语,可用于记录转换。

请注意,这需要进行一些编程-并且需要花一些时间来探究EA提供的COM API以及可能的存储库模型。但是,它并不是那么不透明-比(例如)Oracle Designer中的存储库模型简单得多。

如果您有一个非常复杂的数据迁移工作,则可以编写脚本来查询模型,以确保(例如)确保您没有任何未映射的项。存储库报告生成器在可以包含在报告中的内容方面也非常灵活-我从它那里获取了满足我大部分需求的自定义报告,没有太多麻烦。您还可以编写从模型中提取数据并将其转储到(例如)电子表格中的内容。

也可以制作包含定制模型元素(EA具有形状和连接器定义功能)的图表,以用于迁移规范的图形化概述。

这种方法的价值在于,您可以自动化迁移文档上的某些控件,并验证您已完全覆盖了所需的一切。例如,您还可以在存储库模型中包括对数据需求的引用,并在这些数据模型与源或目标数据模型之间使用特殊标记的链接。

ETL工具:如果可以使用同类最佳的ETL工具之一(例如Informatica Powercentre),则可以在其中设置映射。一些ETL工具是相当自说明的,您也可以使用该工具进行迁移。SSIS将进行映射,但是它不是以这种方式自我记录。

你真正想要的是与元模型已位于设置映射CASE工具。不幸的是我不知道这样的产品。


1

我建议使用kendalvandyke的SQL Power Doc。它是使用Windows PowerShell完成相当不错的SQL Server和Windows文档的最佳免费工具。可在Codeplex上获得IT。

SQL Power Doc是Windows PowerShell脚本和模块的集合,这些脚本和模块可发现,记录和诊断SQL Server实例及其基础Windows OS和计算机配置。SQL Power Doc可用于从SQL Server 2000到2012的所有版本的SQL Server,以及从Windows 2000和Windows XP到Windows Server 2012和Windows 8的所有版本的Windows Server和使用者Windows操作系统。SQLPower Doc也能够提供文档Windows Azure SQL数据库。


0

我已经成功使用了Red Gate的SQL Doc。设置简单,并提供了很好的文档。但是,如果您正在寻找表和视图的图形表示以及它们之间的关系,那么我将无济于事。


0

以我的经验,我尝试过的现成应用程序都没有提供足够的可用信息。以我的看法,我们对企业中几乎所有有价值的事物进行建模和存储。数据本身的价值是否小于企业的其他资产?那为什么我们不同时记录数据和其他资产呢?“元数据存储库”不能准确描述实际需要的内容,因为它描绘了一堆定义和结构的图片,这些定义和结构“坐在那里”大多数未使用,事实并非如此。“元数据应用程序”是一个更好的术语。

我将以对其他数据进行建模的方式对元数据进行建模:考虑如何使用它,创建元数据数据模型或“元模型”,创建类似的架构结构,填充表,使用数据。然后,您不仅可以记录您的元数据,还可以对其进行分析,发现问题甚至进行预测。


-1

根据我在大型医疗机构工作的个人经验,该机构有多个付款人和提供者数据来自多个来源,使用excel电子表格进行记录和映射确实是一项艰巨的任务。我们的AnalytiX映射经理(www.analytixds.com)主任建议我们进行POC。他在会议上遇到的人。我们使用了一个实际的用例,结果非常出色。解决方案是从Web浏览器访问100%驱动的元数据。我们已在企业级使用它。它可以扫描和组织来自各种数据库,数据模型,平面文件和非结构化数据的元数据,并通过其影响分析和数据沿袭来确定上游和下游的依存关系。GUI具有易于使用的拖放用户界面来创建映射规范,因此用户界面友好。我们不仅构建映射和文档,还为内部使用的Informatica和SSIS ETL工具自动生成ETL作业。您可以轻松导入旧的电子表格,并使用内置的可自定义映射模板来实施映射标准,并具有完整的版本控制。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.