Tento jediný příkaz by měl udělat vše:
WITH blacklist AS ( -- identify duplicate IDs and their master
SELECT *
FROM (
SELECT transcription_id
, min(transcription_id) OVER (PARTITION BY text, citation) AS master_id
FROM transcription
) sub
WHERE transcription_id <> master_id
)
, upd AS ( -- redirect referencing rows
UPDATE town_transcription tt
SET transcription_id = b.master_id
FROM blacklist b
WHERE b.transcription_id = tt.transcription_id
)
DELETE FROM transcription t -- kill dupes (now without reference)
USING blacklist b
WHERE b.transcription_id = t.transcription_id;
Pro nedostatek definice jsem zvolil řádek s nejmenším ID na skupinu jako přežívající hlavní řádek.
Omezení FK nepřekáží, pokud nemáte jiné než výchozí nastavení. Podrobné vysvětlení:
- Jak odstranit duplicitní řádky se závislostmi na cizích klíčích?
- Smažte duplikáty a přesměrujte odkazující řádky na novou předlohu
Po odstranění dupů můžete nyní chtít přidat UNIQUE
omezení, které zabrání opakování stejné chyby:
ALTER TABLE transcription
ADD CONSTRAINT transcription_uni UNIQUE (text, citation);