Menemukan nilai duplikat dalam sebuah tabel SQL

Question

Lebih

Sumber Tidak AMP-versi Sunting

Menemukan nilai duplikat dalam sebuah tabel SQL

It's mudah untuk menemukan duplikat dengan satu bidang:

SELECT name, COUNT(email) 
FROM users
GROUP BY email
HAVING COUNT(email) > 1

Jadi jika kita memiliki sebuah tabel

ID   NAME   EMAIL
1    John   asd@asd.com
2    Sam    asd@asd.com
3    Tom    asd@asd.com
4    Bob    bob@asd.com
5    Tom    asd@asd.com

Query ini akan memberikan kita John, Sam, Tom, Tom karena mereka semua sama-sama email.

Namun, apa yang saya inginkan adalah untuk mendapatkan duplikat dengan sama email dan nama.

Artinya, saya ingin mendapatkan "Tom", "Tom".

Alasan saya perlu ini: saya membuat kesalahan, dan diizinkan untuk menyisipkan duplikat nama dan email nilai-nilai. Sekarang saya perlu untuk menghapus/mengubah duplikat, jadi saya perlu menemukan mereka terlebih dahulu.

Pang

Pertanyaan edit 13 September 2019 в 2:18

Pemrograman

sql duplicates

7 April 2010 в 6:17

15 tayangan

Mengomentari pertanyaan (2)

KM.

Sumber Tidak AMP-versi Sunting

coba ini:

declare @YourTable table (id int, name varchar(10), email varchar(50))

INSERT @YourTable VALUES (1,'John','John-email')
INSERT @YourTable VALUES (2,'John','John-email')
INSERT @YourTable VALUES (3,'fred','John-email')
INSERT @YourTable VALUES (4,'fred','fred-email')
INSERT @YourTable VALUES (5,'sam','sam-email')
INSERT @YourTable VALUES (6,'sam','sam-email')

SELECT
    name,email, COUNT(*) AS CountOf
    FROM @YourTable
    GROUP BY name,email
    HAVING COUNT(*)>1

OUTPUT:

name       email       CountOf
---------- ----------- -----------
John       John-email  2
sam        sam-email   2

(2 row(s) affected)

jika anda ingin Id dups gunakan ini:

SELECT
    y.id,y.name,y.email
    FROM @YourTable y
        INNER JOIN (SELECT
                        name,email, COUNT(*) AS CountOf
                        FROM @YourTable
                        GROUP BY name,email
                        HAVING COUNT(*)>1
                    ) dt ON y.name=dt.name AND y.email=dt.email

OUTPUT:

id          name       email
----------- ---------- ------------
1           John       John-email
2           John       John-email
5           sam        sam-email
6           sam        sam-email

(4 row(s) affected)

untuk menghapus duplikat coba:

DELETE d
    FROM @YourTable d
        INNER JOIN (SELECT
                        y.id,y.name,y.email,ROW_NUMBER() OVER(PARTITION BY y.name,y.email ORDER BY y.name,y.email,y.id) AS RowRank
                        FROM @YourTable y
                            INNER JOIN (SELECT
                                            name,email, COUNT(*) AS CountOf
                                            FROM @YourTable
                                            GROUP BY name,email
                                            HAVING COUNT(*)>1
                                        ) dt ON y.name=dt.name AND y.email=dt.email
                   ) dt2 ON d.id=dt2.id
        WHERE dt2.RowRank!=1
SELECT * FROM @YourTable

OUTPUT:

id          name       email
----------- ---------- --------------
1           John       John-email
3           fred       John-email
4           fred       fred-email
5           sam        sam-email

(4 row(s) affected)

simhumileco

Jawaban edit 10 April 2018 в 8:46

348

0

Komentar (0)

Chris Van Opstal

Sumber Tidak AMP-versi Sunting

Coba ini:

SELECT name, email
FROM users
GROUP BY name, email
HAVING ( COUNT(*) > 1 )

110

0

Komentar (0)

AncAinu

Sumber Tidak AMP-versi Sunting

Jika anda ingin menghapus duplikat, di sini's cara yang lebih sederhana untuk melakukan itu daripada harus menemukan genap/ganjil baris ke tiga sub-pilih:

SELECT id, name, email 
FROM users u, users u2
WHERE u.name = u2.name AND u.email = u2.email AND u.id > u2.id

Dan untuk menghapus:

DELETE FROM users
WHERE id IN (
    SELECT id/*, name, email*/
    FROM users u, users u2
    WHERE u.name = u2.name AND u.email = u2.email AND u.id > u2.id
)

Jauh lebih mudah untuk membaca dan memahami IMHO

Catatan: Satu-satunya masalah adalah bahwa anda harus mengeksekusi permintaan tersebut sampai tidak ada baris yang dihapus, karena anda hanya menghapus 1 dari masing-masing menduplikasi setiap waktu

AncAinu

Jawaban edit 30 Desember 2016 в 12:37

62

0

Komentar (7)

gaurav singh

Sumber Tidak AMP-versi Sunting

Coba yang berikut ini:

SELECT * FROM
(
    SELECT Id, Name, Age, Comments, Row_Number() OVER(PARTITION BY Name, Age ORDER By Name)
        AS Rank 
        FROM Customers
) AS B WHERE Rank>1

41

0

Komentar (1)

PRADEEPTA VIRLLEY

Sumber Tidak AMP-versi Sunting

 SELECT name, email 
    FROM users
    WHERE email in
    (SELECT email FROM users
    GROUP BY email 
    HAVING COUNT(*)>1)

27

0

Komentar (0)

Indivision Dev

Sumber Tidak AMP-versi Sunting

Sedikit terlambat ke pesta tapi saya menemukan yang benar-benar keren pemecahan masalah untuk menemukan semua duplikat Id:

SELECT GROUP_CONCAT( id )
FROM users
GROUP BY email
HAVING ( COUNT(email) > 1 )

22

0

Komentar (3)

Tanmay Nehete

Sumber Tidak AMP-versi Sunting

coba kode ini

WITH CTE AS

( SELECT Id, Name, Age, Comments, RN = ROW_NUMBER()OVER(PARTITION BY Name,Age ORDER BY ccn)
FROM ccnmaster )
select * from CTE

Tanmay Nehete

Jawaban edit 30 Januari 2018 в 8:50

19

0

Komentar (0)

Martin Silovský

Sumber Tidak AMP-versi Sunting

Ini memilih/menghapus semua duplikat catatan kecuali satu record dari masing-masing kelompok duplikat. Jadi, menghapus daun semua catatan unik + satu record dari masing-masing kelompok duplikat.

Pilih duplikat:

SELECT *
FROM table
WHERE
    id NOT IN (
        SELECT MIN(id)
        FROM table
        GROUP BY column1, column2
);

Menghapus duplikat:

DELETE FROM table
WHERE
    id NOT IN (
        SELECT MIN(id)
        FROM table
        GROUP BY column1, column2
);

Diketahui jumlah yang lebih besar dari catatan, hal ini dapat menyebabkan masalah kinerja.

Martin Silovský

Jawaban edit 9 Januari 2018 в 1:25

17

0

Komentar (4)

xDBA

Sumber Tidak AMP-versi Sunting

Dalam kasus anda bekerja dengan Oracle, dengan cara ini akan lebih baik:

create table my_users(id number, name varchar2(100), email varchar2(100));

insert into my_users values (1, 'John', 'asd@asd.com');
insert into my_users values (2, 'Sam', 'asd@asd.com');
insert into my_users values (3, 'Tom', 'asd@asd.com');
insert into my_users values (4, 'Bob', 'bob@asd.com');
insert into my_users values (5, 'Tom', 'asd@asd.com');

commit;

select *
  from my_users
 where rowid not in (select min(rowid) from my_users group by name, email);

15

0

Komentar (0)

Narendra

Sumber Tidak AMP-versi Sunting

select name, email
, case 
when ROW_NUMBER () over (partition by name, email order by name) > 1 then 'Yes'
else 'No'
end "duplicated ?"
from users

8

0

Komentar (3)

shekhar singh

Sumber Tidak AMP-versi Sunting

Jika anda ingin melihat apakah ada duplikat dalam tabel anda, saya menggunakan Query di bawah ini:

create table my_table(id int, name varchar(100), email varchar(100));

insert into my_table values (1, 'shekh', 'shekh@rms.com');
insert into my_table values (1, 'shekh', 'shekh@rms.com');
insert into my_table values (2, 'Aman', 'aman@rms.com');
insert into my_table values (3, 'Tom', 'tom@rms.com');
insert into my_table values (4, 'Raj', 'raj@rms.com');

Select COUNT(1) As Total_Rows from my_table 
Select Count(1) As Distinct_Rows from ( Select Distinct * from my_table) abc

8

0

Komentar (0)

Darrel Lee

Sumber Tidak AMP-versi Sunting

Ini adalah hal yang mudah yang saya've datang dengan. Menggunakan ekspresi meja yang umum (CTE) dan partisi jendela (saya pikir fitur ini di SQL 2008 dan kemudian).

Contoh ini menemukan semua mahasiswa dengan nama duplikat dan dob. Bidang yang anda ingin memeriksa duplikasi pergi di ATAS klausa. Anda dapat mencakup bidang-bidang lain yang anda inginkan dalam proyeksi.

with cte (StudentId, Fname, LName, DOB, RowCnt)
as (
SELECT StudentId, FirstName, LastName, DateOfBirth as DOB, SUM(1) OVER (Partition By FirstName, LastName, DateOfBirth) as RowCnt
FROM tblStudent
)
SELECT * from CTE where RowCnt > 1
ORDER BY DOB, LName

Darrel Lee

Jawaban edit 1 Juli 2016 в 7:20

8

0

Komentar (0)

Debendra Dash

Sumber Tidak AMP-versi Sunting

select id,name,COUNT(*) from India group by Id,Name having COUNT(*)>1

8

0

Komentar (0)

Debendra Dash

Sumber Tidak AMP-versi Sunting

Dengan Menggunakan CTE juga kita dapat menemukan nilai duplikat seperti ini

with MyCTE
as
(
select Name,EmailId,ROW_NUMBER() over(PARTITION BY EmailId order by id) as Duplicate from [Employees]

)
select * from MyCTE where Duplicate>1

7

0

Komentar (0)

Muhammad Tahir

Sumber Tidak AMP-versi Sunting

Bagaimana kita bisa menghitung digandakan nilai-nilai?? entah itu berulang 2 kali atau lebih besar dari 2. hitung saja, bukan kelompok yang bijaksana.

sesederhana

select COUNT(distinct col_01) from Table_01

7

0

Komentar (1)

naveed

Sumber Tidak AMP-versi Sunting

 select emp.ename, emp.empno, dept.loc 
          from emp
 inner join dept 
          on dept.deptno=emp.deptno
 inner join
    (select ename, count(*) from
    emp
    group by ename, deptno
    having count(*) > 1)
 t on emp.ename=t.ename order by emp.ename
/

6

0

Komentar (0)

user4877838

Sumber Tidak AMP-versi Sunting

SELECT id, COUNT(id) FROM table1 GROUP BY id MEMILIKI COUNT(id)>1;

Saya pikir ini akan bekerja dengan baik untuk pencarian berulang-nilai dalam kolom tertentu.

6

0

Komentar (2)

veritaS

Sumber Tidak AMP-versi Sunting

Ini juga harus bekerja, mungkin memberikan ini mencoba.

  Select * from Users a
            where EXISTS (Select * from Users b 
                where (     a.name = b.name 
                        OR  a.email = b.email)
                     and a.ID != b.id)

Terutama baik dalam kasus anda Jika anda mencari duplikat yang memiliki beberapa jenis awalan atau umum perubahan, seperti misalnya domain baru di mail. kemudian anda dapat menggunakan replace() pada kolom ini

5

0

Komentar (0)

Panky031

Sumber Tidak AMP-versi Sunting

SELECT * FROM users u where rowid = (select max(rowid) from users u1 where
u.email=u1.email);

4

0

Komentar (0)

gbn · Accepted Answer · 2010-04-07T18:20:18+00:00

SELECT
    name, email, COUNT(*)
FROM
    users
GROUP BY
    name, email
HAVING 
    COUNT(*) > 1

Hanya kelompok pada kedua kolom.

Catatan: yang lebih tua ANSI standar ini untuk memiliki semua non-agregat kolom dalam KELOMPOK DENGAN tetapi hal ini telah berubah dengan ide "ketergantungan fungsional":

Dalam database relasional teori, ketergantungan fungsional adalah kendala antara dua set atribut dalam suatu relasi dari database. Dengan kata lain, ketergantungan fungsional adalah kendala yang menggambarkan hubungan antara atribut-atribut dalam suatu relasi.

Dukungan tidak konsisten:

Baru-baru ini PostgreSQL mendukung.
SQL Server (seperti pada SQL Server 2017) masih membutuhkan semua non-agregat kolom di GROUP BY.
MySQL tidak dapat diprediksi dan anda perlu sql_mode=only_full_group_by:
https://stackoverflow.com/q/10894820/27535;
https://stackoverflow.com/questions/6060241/which-is-the-least-expensive-aggregate-function-in-the-absence-of-any/6060414#6060414 (lihat komentar di jawaban yang diterima).
Oracle isn't mainstream cukup (warning: humor, I don't tahu tentang Oracle).