SQL Doppelte Einträge einer Tabelle anzeigen

Hotshady · 29. April 2015

Hallo,

ich versuche mich gerade an einer Abfrage, mit der ich Zeilen aus einer Tabelle auflisten kann, die in einer bestimmten Spalte den gleichen Wert haben.
Mit diesem Statement komme ich nicht allzu weit. Es werden lediglich die Anzahl der doppelten Einträge angezeigt. Also eine Spalte mit bspw. der Zahl 7 bedeutet, dass es ein 7 Datensätze für einen bestimmten Eintrag in der gesuchten Spalte gibt. Ich möchte allerdings die 7 Einträge komplett mit allen anderen Spalten angezeigt bekommen.

SELECT [Spaltenname]
FROM [Tabellenname]
GROUP BY [Spaltenname]
HAVING COUNT (*) > 1

Jemand eine Idee, wie ich das am besten bewerkstelligen kann?

Madman1209 · 29. April 2015

Hi,

funktioniert bei mir. Welches SQL benutzt du? MySQL?

Ich möchte allerdings die 7 Einträge komplett mit allen anderen Spalten angezeigt bekommen

Dann musst du natürlich die Spalten selektieren, die du gerne hättest.

VG,
Mad

NullPointer · 29. April 2015

Ich würde es mal mit einer Subquery versuchen, etwa so:

SELECT * FROM [Tabellenname] WHERE [Spaltenname] IN ([deine Query])

Hotshady · 29. April 2015

Hallo,

ich nutze postgresql. Weißt Du, ob es da einen Unterschied bei den Befehlen gibt?

Madman1209 · 29. April 2015

Hi,

in MySQL läuft es definitiv. Kannst du dein Query mal konkret exakt so posten wie du es absetzt? Also ohne Platzhalter? Im Grunde sollte das schon auch funktionieren, ich kenne allerdings postgresql nicht.

VG,
Mad

Hotshady · 29. April 2015

Die Tabelle hat 90 Spalten und ich möchte alle haben wo eine Übereinstimmung bspw. in SPalte X besteht (doppelter Eintrag in X). Muss ich da bei GROUP BY jetzt echt alle SPalten aufführen??

raekaos · 29. April 2015

Ich würd es auch mit der Unterabfrage versuchen

Das WHERE ... IN (SELECT...) funktioniert auf jeden Fall in Postgre

Folgende Seite Postgresqltutorial.com kann ich dir nur wärmstens ans Herz legen ist wirklich gut und hat mir bisher immer geholfen.

Madman1209 · 29. April 2015

Hi,

erkläre bitte nochmal: möchtest du JEDE Spalte auf Duplikate prüfen? Oder was genau? Dein Startpost las sich so, dass du EINE Spalte auf Duplikate prüfen willst und am Ende alle Datensätze komplett ausgegeben haben möchtest.

Wenn das so ist musst du nicht im GROUP BY alle aufführen sondern im SELECT, oder eben einfach ein "*".

VG,
Mad

Hotshady · 29. April 2015

Ich schau mir das Tutorial an und probier die Unterabfrage mal aus. Zum Verständnis was das Problem eigentlich ist:

Ich habe eine Tabelle mit 90 Spalten und mehreren tausend Zeilen. In einer dieser Spalten wird ein Wert abgelegt, der in dieser Tabelle nur ein Mal vorkommen darf (also jede Zeile der Tabelle, darf in der gesuchten Spalte keine gleichen Einträge haben --> hat nix mit PK oder FK zu tun). Ich suche nun nach einer Möglichkeit um

a) zu prüfen, wo es in der gesuchten Spalte Einträge mit dem identischen Inhalt gibt und
b) möchte mir dann den kompletten Inhalt (also Zeilen mit allen Spalten) zu diesen doppelten Einträgen aufzeigen lassen.

Madman1209 · 29. April 2015

Hi,

ok, doch richtig verstanden

Also in MySQL ist der Befehl der, den du benutzt hast.

SELECT *
FROM `table`
group by `spalte`
HAVING COUNT(*) > 1

So kriege ich die kompletten Datensätze, in denen in Spalte "spalte" ein Wert mehrfach vorkommt. postgresql scheint da anders zu arbeiten wenn das nicht funktioniert.

VG,
Mad

raekaos · 29. April 2015

@Mad bei deiner Notation bekommen ich sowohl in SQL als auch in Postgre Fehler

So sollte es gehen aber gehen:

SELECT *
FROM DeineDB
WHERE (SELECT COUNT(B.SpaltemitdoppeltenWerten) FROM DeineDB AS B WHERE B.SpaltemitdoppeltenWerten= SpaltemitdoppeltenWerten) > 1
ORDER BY SpaltemitdoppeltenWerten

Madman1209 · 29. April 2015

Hi,

bei mir funktioniert exakt diese Abfrage, so wie ich sie oben geschrieben habe, im MySQL Query Browser. Sehr strange.

VG,
Mad

Hotshady · 29. April 2015

Hi,

die Abfrage von raekaos funktioniert. Danke!

Daaron · 29. April 2015

Hotshady schrieb:
Ich habe eine Tabelle mit 90 Spalten und mehreren tausend Zeilen. In einer dieser Spalten wird ein Wert abgelegt, der in dieser Tabelle nur ein Mal vorkommen darf (also jede Zeile der Tabelle, darf in der gesuchten Spalte keine gleichen Einträge haben --> hat nix mit PK oder FK zu tun).

PK und FK mögen hier nicht relevant sein, aber ein Index ist trotzdem die Lösung, genauer gesagt ein Unique Key (bzw. Unique Constrain).

Hotshady · 30. April 2015

Moin, ich nochmal. Ich bräuchte nochmal kurz Hilfe zu der Abfrage:

SELECT *
FROM MeineTabelle AS A
WHERE A.Feld_Kunde= 'Kunde' AND A.Spalte_mit_doppelten_Werten IS NOT NULL AND
(SELECT COUNT(B.Spalte_mit_doppelten_Werten) FROM MeineTabelle AS B WHERE B.Spalte_mit_doppelten_Werten= Spalte_mit_doppelten_Werten) > 1
ORDER BY Spalte_mit_doppelten_Werten
LIMIT 100

Ich bekomme in der Spalte_mit_doppelten_Werten trotz der Anweisung "IS NOT NULL" als Ergebnis der Abfrage leere Felder in der Spalte ausgegeben. Was mache ich falsch?!

Edit: Ich hab das Limit mal auf 10000 gesetzt und es sind immer noch alle Felder in Spalte_mit_doppelten_Werten leer. Hängt das vielleicht mit der bfrage ansich zusammen?

Darlis · 30. April 2015

Kann es sein, dass in den "leeren Feldern" einfach ein leerer String anstatt NULL drin steht? Das müsstest du dann auch abfangen.

Lord_British · 25. Juli 2022

raekaos schrieb:
@Mad bei deiner Notation bekommen ich sowohl in SQL als auch in Postgre Fehler

So sollte es gehen aber gehen:

SELECT *
FROM DeineDB
WHERE (SELECT COUNT(B.SpaltemitdoppeltenWerten) FROM DeineDB AS B WHERE B.SpaltemitdoppeltenWerten= SpaltemitdoppeltenWerten) > 1
ORDER BY SpaltemitdoppeltenWerten

Hallo, auch wenn dieser Thread sehr alt ist, eine Frage:
Ich bekomme dein Skript zum Laufen, aber mir fehlt etwas.

Aufgabe:
Es gibt in der Tabelle Kontakt ca. 500 Datensätze.
Primary Key = Kontakt_Nummer zB M4711
Weitere Felder: Strasse, PLZ, Ort

Ich soll eine Liste machen, die so aussieht:

M4711 Musterstrasse 123 78400 Konstanz M0815 Musterstrasse 123 78400 Konstanz
M0815 Musterstrasse 123 78400 Konstanz M4711 Musterstrasse 123 78400 Konstanz

=> d.h. alle Datensätze liefern mit jeweils Primary Key, bei denen die Felder Strasse, PLZ, Ort exakt übereinstimmen. Dann wird ein Sachbearbeiter anhand dieser Liste die Doubletten manuell prüfen.

Daher frage ich mich, wie ich B.SpaltemitdoppeltenWerten erweitere auf B. mehrere Spalten mit doppelten Werten?

Evtl. so: B.SpaltemitdoppeltenWerten_1 AND B.SpaltemitdoppeltenWerten_2 AND B.SpaltemitdoppeltenWerten_3 AND B.SpaltemitdoppeltenWerten_4 etc......

raekaos · 25. Juli 2022

@Lord_British
Ich denke dieser Link wird dir helfen:
stackoverflow - How to get multiple counts with one SQL query?

Lord_British · 25. Juli 2022

Danke sehr! Sehr viel Code, den ich noch durcharbeiten werde.

Ich hab mittlerweile eine gute Erklärung fürs ERP-System gefunden, welches die DB befüllt.

https://www.arksolutions.de/gs/dynamics-nav/blog/dublettensuche-in-dynamics-nav-classic-client

SQL Doppelte Einträge einer Tabelle anzeigen

Lt. Junior Grade

Fleet Admiral

Lt. Commander

Lt. Junior Grade

Fleet Admiral

Lt. Junior Grade

Commander Pro

Fleet Admiral

Lt. Junior Grade

Fleet Admiral

Commander Pro

Fleet Admiral

Lt. Junior Grade

Fleet Admiral

Lt. Junior Grade

Commodore

Ensign

Commander Pro

Ensign

Ähnliche Themen