另一种可能的方式是
;
--Ensure that any immediately preceding statement is terminated with a semicolon above
WITH cte
AS (SELECT ROW_NUMBER() OVER (PARTITION BY Col1, Col2, Col3
ORDER BY ( SELECT 0)) RN
FROM #MyTable)
DELETE FROM cte
WHERE RN > 1;
我在ORDER BY (SELECT 0)
上面使用,因为在打平时保留哪一行是任意的。
为了保留最新的RowID
顺序,例如,您可以使用ORDER BY RowID DESC
执行计划
执行计划通常比接受的答案更简单,更有效,因为它不需要自我连接。
但是,并非总是如此。一种GROUP BY
可能是首选解决方案的地方是优先选择散列聚合而不是流聚合的情况。
该ROW_NUMBER
解决方案将始终提供几乎相同的计划,而该GROUP BY
策略则更为灵活。
可能支持散列聚合方法的因素是
- 分区列上没有有用的索引
- 相对较少的组,每组中重复项相对较多
在第二种情况的极端版本中(如果每个组中很少有很多重复的组),还可以考虑简单地将行插入以保存到新表中,然后TRUNCATE
对原始行进行-ing并将其复制回去,从而与删除行的比例很高。
DELETE FROM
直接使用CTE术语。参见stackoverflow.com/q/18439054/398670