目前,我正在比较两个包含唯一StoreKey/ProductKey
组合的数据集。
第一个数据集具有StoreKey/ProductKey
2012年1月开始至2014年5月结束之间的唯一销售组合(结果= 45万行)。第二个数据集具有独特的StoreKey/ProductKey
组合,从2014年6月开始销售到今天(结果= 190K行)。
我正在寻找StoreKey/ProductKey
第二组中的组合,但不在第一组中-即从6月初开始销售的新产品。
到目前为止,我已经将这两个数据集转储到了临时表中,在两个键上都为这两个表创建了索引,并使用该EXCEPT
语句查找了唯一项。
比较这么大的数据集最有效的方法是什么?有没有更有效的方式进行这种大型比较?