Zum Inhalt springen

Denkproblem mit Access


LucyLoreley

Empfohlene Beiträge

Hallo,

ich hoffe ich kann mein problem richtig beschreiben.

Also ich habe mehrer (12) Excel-Tabellen mit jeweils 10000 Einträgen. In diesen Excel-Tabellen stehen Schlagworte drinnen....sieht wie folgt aus:

Spalte 1 Spalte 2

2384 Test Text sind davon Index

4892 Mensch Daten Transfer usw

Spalte 1 = Dokumentennr. (kein Primärschlüssel)

Spalte 2 = mehrer Schlagwörter, es kann ein ganzer Satz drinnen stehn

bzw 2 Wörter die zusammen gehören oder auch einzelne Schlag-

wörter.

Diese Schlagwörter müssen sinnvoll durch ein ";" getrennt werden. Da es sich aber um 120000 Einträge handelt würde es ewig dauern. Es gibt auch duplikate..das heist in der Spalte B2 steht nach Text Test "Aluminium". Aluminium kommt auch in 20 weiteren Spalten vor...aber nicht immer an gleicher Stelle.

Mann kann dies bestimmt über access regeln.

ich habe alle Excel Tabellen importiert in eine Datenbank.

Ich kann auch die Duplikate ausfindig machen....aber irgendwie happerts noch ein bisschen an der umsetzung.

kann mir jemand einen kleinen Denkanstoß geben??

Link zu diesem Kommentar
Auf anderen Seiten teilen

Also die Tabellen in Access beinhalten vorerst nur 2 Spalten.

Spalte 1 = Dokumentnummer

Spalte 2 = die Zeichenkette mit den mehreren Schlagwörtern

Z.B. kommt das Wort Aluminium ca 3000 vor...aber in unterschiedlichen

dokumenten (dokumentnr.)

und dieses wort steht aber in den Zeichenketten in unterschiedlicher Reihenfolge z.B.

Spalte 10: Maschine Rollanlage Aluminium Test

Spalte 2002: Test Aluminium Käse Brot

aber eben in verschiedenen dokumenten und diese Zeichenketten sind nicht durch kommas oder so getrennt sollten aber durch Strichpunkte getrennt werden.

ich wollte die irgendwie durch nen Key oder so markieren...aber irgendwie fehlt mir da was..oder bin ihc jetzt voll falsch?

Link zu diesem Kommentar
Auf anderen Seiten teilen

Also deine Datenbank sieht dann wohl so aus:


DokumentNr.   |   Beschreibung

1                 Hund Katze Maus

2                 Hund Elefant Igel

3                 Elefant Giraffe Maus

Und sie sollte aber so aussehen:

DokumentNr.   |   Beschreibung

1                 Hund Katze Maus

2                 Elefant Igel

3                 Giraffe

Also die doppelten entfernen? Wird so wie die Tabelle jetzt aufgebaut ist schwierig. Es sollte eher ein Stichwort in einer Zeile stehen. Also so:

DokumentNr.   |   Beschreibung

1                 Hund

1                 Katze

1                 Maus

2                 Elefant

2                 Igel

3                 Giraffe

Link zu diesem Kommentar
Auf anderen Seiten teilen

habe mal nen denkansatz:

alle datensätze einmalig einlesen und in neue struktur speichern (der text muss gesplittet werden nach jedem leerzeichen)


DokumentNr.   |   Beschreibung

1                 Hund

1                 Katze

1                 Maus

2                 Elefant

2                 Igel

3                 Giraffe

danach löschst du alle doppelten aus dieser tabelle

dann fügst du die nach der dok-nr wieder zusammen mit leerzeichen dazwischen

is wohl viel arbeit :/

andere möglichkeit:

ein programm schreiben, welches den *.csv-export von excel einliest, einen array intus hat, welcher sich alle wörter merkt. wird ein wort gelesen, welches schonmal vorhanden war -> raus damit.

is wohl auch viel arbeit :/

Link zu diesem Kommentar
Auf anderen Seiten teilen

Dein Kommentar

Du kannst jetzt schreiben und Dich später registrieren. Wenn Du ein Konto hast, melde Dich jetzt an, um unter Deinem Benutzernamen zu schreiben.

Gast
Auf dieses Thema antworten...

×   Du hast formatierten Text eingefügt.   Formatierung wiederherstellen

  Nur 75 Emojis sind erlaubt.

×   Dein Link wurde automatisch eingebettet.   Einbetten rückgängig machen und als Link darstellen

×   Dein vorheriger Inhalt wurde wiederhergestellt.   Editor leeren

×   Du kannst Bilder nicht direkt einfügen. Lade Bilder hoch oder lade sie von einer URL.

Fachinformatiker.de, 2024 by SE Internet Services

fidelogo_small.png

Schicke uns eine Nachricht!

Fachinformatiker.de ist die größte IT-Community
rund um Ausbildung, Job, Weiterbildung für IT-Fachkräfte.

Fachinformatiker.de App

Download on the App Store
Get it on Google Play

Kontakt

Hier werben?
Oder sende eine E-Mail an

Social media u. feeds

Jobboard für Fachinformatiker und IT-Fachkräfte

×
×
  • Neu erstellen...