Zum Inhalt springen

Excel: Doppelte Datensätze herausfinden und löschen ???


Empfohlene Beiträge

Geschrieben

Hallo,

habe hier eine adressen.xls Liste mit ca. 3500 Einträgen.

Spalten:

Firma, Anschrift, Plz, Ort, Tel, Email, etc. Modell.ID

Jetzt würde ich gerne die ganzen Mehrfacheinträge löschen. Mit der Hand dauert das ja ewig!

Wie geht das?

Gruß Hajooo

Geschrieben
Original geschrieben von Zonkman8

Also ich würde das irgendwie über die Mail-Adresse filtern. Die dürfte ja eindeutig sein.

Oder du machst es mit Access, statt mit Excel und filterst die Daten mit SQL.

Hi,

wenn ich über die Emailadresse filtere, löscht er mir auch die Einträge raus, die leer sind !

Das Ziel ist ja nur die Duplikate, welche in allen Spalten doppelt sind herauszufiltern.

Mit SQL ???

Jooo,

man soll den Feind umarmen ! ;)

Gruß Hajooo

Geschrieben

Du kannst es auch machen, indem du die Datensätze nach der Mail-Adresse sortieren lässt. Anschliessend könntest du mit einem Makro die Liste von oben nach unten durcharbeiten und und die aktuelle Zeile mit der nächsten Zeile vergleichen. Wenn diese gleich sind, dann kannst du eine von diesen löschen. Ausnahme dabei stellen dann nur die Datensätze, in denen keine Mail-Adresse angegeben ist.

Geschrieben

Hallo Magoo,

geht das auch auf "normalem" Wege ?

;)

Hört sich ja kompliziert an?

Was passiert bei diesem Abgleich mit den Email-Zellen die leer sind?

Z.B.: Firma, Plz, Strasse, Ort, haben wenig leere Zellen.

Gruß Hajooo

Geschrieben
Original geschrieben von Hajooo

geht das auch auf "normalem" Wege ?

;)

Das ist doch ein normaler Weg! :floet:

Original geschrieben von Hajooo

Was passiert bei diesem Abgleich mit den Email-Zellen die leer sind?

Z.B.: Firma, Plz, Strasse, Ort, haben wenig leere Zellen.

Naja, das kannst du selbst bestimmen. Entweder filterst du diese raus in eine separate Datei, die du manuell vergleichst, oder du lässt sie unberührt in deiner liste oder sonst was.

Ich selber würde aber wahrscheinlich hingehen und die restlichen Felder (Firma, Strasse, PLZ, Ort) auch noch vergleichen und wenn diese gleich sind hast du deinen doppelten Datensatz gefunden.

Das setzt natürlich voraus, das du deine Datensätze noch etwas anders sortierst. z.B. erst nach eMail, dann nach Firma, dann nach PLZ oder so ähnlich...

Wie sieht es denn aus mit den Daten? Sind gleiche Firmen auch gleich geschrieben? Oder sind die ähnlich geschrieben?

Weisst du mit VBA etwas anzufangen?

  • 5 Jahre später...
Geschrieben

hallo,

bin gerade auf das Thema gestoßen. Habe eine ähnliche Problemstellung.

Wie sieht es denn aus mit den Daten? Sind gleiche Firmen auch gleich geschrieben? Oder sind die ähnlich geschrieben?

Ich habe eine Excel-Tabelle mit ca. 8000 Kundendatensätze und möchte die mehrfach vorhandenen Datensätze automatisch löschen. Da die Kundendaten von verschiedenen Quellen aus dem Internet zusammen kopiert worden, sind die Firmen nicht immer gleich geschrieben, auch das Straße ist nicht immer einheitlich (z.B. Haupstr. vs. Hauptstraße vs. Hauptstrasse).

Hat jemand eine Idee wie ich dieses Problem lösen kann? Ich hab schon versucht eine Makro zu schreiben bin aber nichtz wirklich weiter gekommen.

Danke schon Mal.

Gruß mmp

Geschrieben
Ich habe eine Excel-Tabelle mit ca. 8000 Kundendatensätze und möchte die mehrfach vorhandenen Datensätze automatisch löschen. Da die Kundendaten von verschiedenen Quellen aus dem Internet zusammen kopiert worden, sind die Firmen nicht immer gleich geschrieben, auch das Straße ist nicht immer einheitlich (z.B. Haupstr. vs. Hauptstraße vs. Hauptstrasse).

Hat jemand eine Idee wie ich dieses Problem lösen kann?

Die ultimative Lösung dafür gibt's wohl nicht - und wenn ist sie ein gut gehütetes Betriebsgeheimnis. Du kannst bestimmte Dinge vereinheitlichen (z.B. "Straße" und "Strasse" immer auf "Str." zurückführen) aber unter den Voraussetzungen wirst du keine 100%ige Dublettenerkennung hinbekommen - irgendein manueller Schritt wird dann immer noch notwendig sein.
Geschrieben

Also meine Idee war es immer die ersten 3-4 Zeichen des Firmennamens zu nehmen und dann mit den anderen Firmennamen zu vergleichen. Das gleiche hätte ich dann bei den vier andreren Spalten (Straße, Anrede, Ansprechpartner, Ort) gemacht.

Wenn es zwischen zwei Datensätze (Zeile) 4 von 5 Übereinstimmungen gibt dann hätte ich den Datensatz gelöscht.

Leider konnte ich das nicht in vba umsetzen. Ist das machbar?

Geschrieben
Bei Excel 2007 kann man über Start -> Bedingte Formatierung -> Regeln zum Hervorheben von Zellen-> Doppelte Werte... gehen ! Klappt super.
Und das findet auch Überschneidungen von "Str." vs "Straße" oder erkennt, dass "Wienerstraße", "Wiener Str.", "Wiener Straße" und "Wiener Strasse" die gleiche Straße meinen?
Geschrieben

Man könnte die Adressen durch einen Adressvalidierer wie uniserv jagen, damit aus Str., Straße, str. ... ein einheitlicher Datensatz erstellt wird und dann diese filtern. Oder es an einen entsprechenden Dienstleister geben.

Beides gibt es z.B. von Uniserv.

Dein Kommentar

Du kannst jetzt schreiben und Dich später registrieren. Wenn Du ein Konto hast, melde Dich jetzt an, um unter Deinem Benutzernamen zu schreiben.

Gast
Auf dieses Thema antworten...

×   Du hast formatierten Text eingefügt.   Formatierung wiederherstellen

  Nur 75 Emojis sind erlaubt.

×   Dein Link wurde automatisch eingebettet.   Einbetten rückgängig machen und als Link darstellen

×   Dein vorheriger Inhalt wurde wiederhergestellt.   Editor leeren

×   Du kannst Bilder nicht direkt einfügen. Lade Bilder hoch oder lade sie von einer URL.

Fachinformatiker.de, 2024 by SE Internet Services

fidelogo_small.png

Schicke uns eine Nachricht!

Fachinformatiker.de ist die größte IT-Community
rund um Ausbildung, Job, Weiterbildung für IT-Fachkräfte.

Fachinformatiker.de App

Download on the App Store
Get it on Google Play

Kontakt

Hier werben?
Oder sende eine E-Mail an

Social media u. feeds

Jobboard für Fachinformatiker und IT-Fachkräfte

×
×
  • Neu erstellen...