你能帮我用SQL语句来查找多个字段的重复项吗?
例如,在伪代码中:
select count(field1,field2,field3)
from table
where the combination of field1, field2, field3 occurs multiple times
并且从上面的陈述 如果有多次出现 我想选择 除第一个以外的每个记录 。
要获取有多个记录的字段列表,您可以使用..
select field1,field2,field3, count(*)
from table_name
group by field1,field2,field3
having count(*) > 1
有关如何删除行的更多信息,请查看此链接。
http://support.Microsoft.com/kb/139444
编辑:正如其他用户所提到的,在使用上述链接中的方法之前,应该有一个标准来决定如何定义“第一行”。基于此,您需要使用order by子句和子查询(如果需要)。如果您可以发布一些示例数据,那将非常有用。
你提到“第一个”,所以我假设你对你的数据有某种排序。假设您的数据按某些字段ID
排序。
除了第一个条目之外,此SQL应该为您提供重复的条目。它基本上选择具有(a)相同字段和(b)较低ID的另一行的所有行。性能不会很好,但它可能会解决您的问题。
SELECT A.ID, A.field1, A.field2, A.field3
FROM myTable A
WHERE EXISTS (SELECT B.ID
FROM myTable B
WHERE B.field1 = A.field1
AND B.field2 = A.field2
AND B.field3 = A.field3
AND B.ID < A.ID)
这是我喜欢的SQL Server 2005的有趣解决方案。我将假设“对于除第一个之外的每个记录”,你的意思是我们可以使用另一个“id”列来标识哪个行是“第一个”。
SELECT id
, field1
, field2
, field3
FROM
(
SELECT id
, field1
, field2
, field3
, RANK() OVER (PARTITION BY field1, field2, field3 ORDER BY id ASC) AS [rank]
FROM table_name
) a
WHERE [rank] > 1
要查看重复值:
with MYCTE as (
select row_number() over ( partition by name order by name) rown, *
from tmptest
)
select * from MYCTE where rown <=1
如果您正在使用SQL Server 2005或更高版本(并且您的问题的标记表示SQL Server 2008),则可以使用排名函数在第一个之后返回重复记录,如果由于某种原因使用连接不太理想或不切实际。以下示例显示了此操作,它还可以在检查的列中使用空值。
create table Table1 (
Field1 int,
Field2 int,
Field3 int,
Field4 int
)
insert Table1
values (1,1,1,1)
, (1,1,1,2)
, (1,1,1,3)
, (2,2,2,1)
, (3,3,3,1)
, (3,3,3,2)
, (null, null, 2, 1)
, (null, null, 2, 3)
select *
from (select Field1
, Field2
, Field3
, Field4
, row_number() over (partition by Field1
, Field2
, Field3
order by Field4) as occurrence
from Table1) x
where occurrence > 1
运行此示例后请注意,排除每个“组”中的第一个记录,并正确处理具有空值的记录。
如果您没有可用于对组中的记录进行排序的列,则可以使用partition-by列作为order-by列。
CREATE TABLE #tmp
(
sizeId Varchar(MAX)
)
INSERT #tmp
VALUES ('44'),
('44,45,46'),
('44,45,46'),
('44,45,46'),
('44,45,46'),
('44,45,46'),
('44,45,46')
SELECT * FROM #tmp
DECLARE @SqlStr VARCHAR(MAX)
SELECT @SqlStr = STUFF((SELECT ',' + sizeId
FROM #tmp
ORDER BY sizeId
FOR XML PATH('')), 1, 1, '')
SELECT TOP 1 * FROM (
select items, count(*)AS Occurrence
FROM dbo.Split(@SqlStr,',')
group by items
having count(*) > 1
)K
ORDER BY K.Occurrence DESC
尝试此查询以获得每个SELECT语句的sepratley计数:
select field1,count(field1) as field1Count,field2,count(field2) as field2Counts,field3, count(field3) as field3Counts
from table_name
group by field1,field2,field3
having count(*) > 1