LucyLoreley Geschrieben 25. Januar 2007 Teilen Geschrieben 25. Januar 2007 Hallo, ich hoffe ich kann mein problem richtig beschreiben. Also ich habe mehrer (12) Excel-Tabellen mit jeweils 10000 Einträgen. In diesen Excel-Tabellen stehen Schlagworte drinnen....sieht wie folgt aus: Spalte 1 Spalte 2 2384 Test Text sind davon Index 4892 Mensch Daten Transfer usw Spalte 1 = Dokumentennr. (kein Primärschlüssel) Spalte 2 = mehrer Schlagwörter, es kann ein ganzer Satz drinnen stehn bzw 2 Wörter die zusammen gehören oder auch einzelne Schlag- wörter. Diese Schlagwörter müssen sinnvoll durch ein ";" getrennt werden. Da es sich aber um 120000 Einträge handelt würde es ewig dauern. Es gibt auch duplikate..das heist in der Spalte B2 steht nach Text Test "Aluminium". Aluminium kommt auch in 20 weiteren Spalten vor...aber nicht immer an gleicher Stelle. Mann kann dies bestimmt über access regeln. ich habe alle Excel Tabellen importiert in eine Datenbank. Ich kann auch die Duplikate ausfindig machen....aber irgendwie happerts noch ein bisschen an der umsetzung. kann mir jemand einen kleinen Denkanstoß geben?? Zitieren Link zu diesem Kommentar Auf anderen Seiten teilen Mehr Optionen zum Teilen...
tobbe Geschrieben 25. Januar 2007 Teilen Geschrieben 25. Januar 2007 Was genau willst du machen? Willst du die Duplikate in der Access-Tabelle entfernen? Wie genau sieht die Tabelle in Access aus? Mit freundlichen Grüßen Tobbe Zitieren Link zu diesem Kommentar Auf anderen Seiten teilen Mehr Optionen zum Teilen...
LucyLoreley Geschrieben 25. Januar 2007 Autor Teilen Geschrieben 25. Januar 2007 Also die Tabellen in Access beinhalten vorerst nur 2 Spalten. Spalte 1 = Dokumentnummer Spalte 2 = die Zeichenkette mit den mehreren Schlagwörtern Z.B. kommt das Wort Aluminium ca 3000 vor...aber in unterschiedlichen dokumenten (dokumentnr.) und dieses wort steht aber in den Zeichenketten in unterschiedlicher Reihenfolge z.B. Spalte 10: Maschine Rollanlage Aluminium Test Spalte 2002: Test Aluminium Käse Brot aber eben in verschiedenen dokumenten und diese Zeichenketten sind nicht durch kommas oder so getrennt sollten aber durch Strichpunkte getrennt werden. ich wollte die irgendwie durch nen Key oder so markieren...aber irgendwie fehlt mir da was..oder bin ihc jetzt voll falsch? Zitieren Link zu diesem Kommentar Auf anderen Seiten teilen Mehr Optionen zum Teilen...
tobbe Geschrieben 25. Januar 2007 Teilen Geschrieben 25. Januar 2007 Also deine Datenbank sieht dann wohl so aus: DokumentNr. | Beschreibung 1 Hund Katze Maus 2 Hund Elefant Igel 3 Elefant Giraffe Maus Und sie sollte aber so aussehen: DokumentNr. | Beschreibung 1 Hund Katze Maus 2 Elefant Igel 3 Giraffe Also die doppelten entfernen? Wird so wie die Tabelle jetzt aufgebaut ist schwierig. Es sollte eher ein Stichwort in einer Zeile stehen. Also so: DokumentNr. | Beschreibung 1 Hund 1 Katze 1 Maus 2 Elefant 2 Igel 3 Giraffe Zitieren Link zu diesem Kommentar Auf anderen Seiten teilen Mehr Optionen zum Teilen...
deano Geschrieben 25. Januar 2007 Teilen Geschrieben 25. Januar 2007 habe mal nen denkansatz: alle datensätze einmalig einlesen und in neue struktur speichern (der text muss gesplittet werden nach jedem leerzeichen) DokumentNr. | Beschreibung 1 Hund 1 Katze 1 Maus 2 Elefant 2 Igel 3 Giraffe danach löschst du alle doppelten aus dieser tabelle dann fügst du die nach der dok-nr wieder zusammen mit leerzeichen dazwischen is wohl viel arbeit :/ andere möglichkeit: ein programm schreiben, welches den *.csv-export von excel einliest, einen array intus hat, welcher sich alle wörter merkt. wird ein wort gelesen, welches schonmal vorhanden war -> raus damit. is wohl auch viel arbeit :/ Zitieren Link zu diesem Kommentar Auf anderen Seiten teilen Mehr Optionen zum Teilen...
LucyLoreley Geschrieben 26. Januar 2007 Autor Teilen Geschrieben 26. Januar 2007 Danke mal für deinen Ansatz. Ich glaube wie ich es mache ist es egal...es ist immer viel arbeit..nur per hand ist es ein schmarn. Ich werd mal deine Methode probieren...Danke schon mal im vorraus Zitieren Link zu diesem Kommentar Auf anderen Seiten teilen Mehr Optionen zum Teilen...
Empfohlene Beiträge
Dein Kommentar
Du kannst jetzt schreiben und Dich später registrieren. Wenn Du ein Konto hast, melde Dich jetzt an, um unter Deinem Benutzernamen zu schreiben.