Gast frfr Geschrieben 26. August 2020 Geschrieben 26. August 2020 Hallo Ich soll demnächst so Java programmieren, der Leiter kommt da mit so Wünschen um die Ecke, da will man nicht nein sagen. Da könnte ein CD aufm Tisch landen (mit dutzenden Dateien), auf der sind Personen aufgeführt, die irgendwie relevant sind (oder sein können) und Chef will die per Briefpost ansprechen, Broschüre zuschicken oder sonstwas. Eine Datei könnte ungefähr so aussehen (viele Firmen in einer Datei) <firma> <firmenname> Mustermann GmbH <Firmenname> <postadresse> bahnhofstr. 11, 55555 Musterhausen <postadresse> <prokurist> Max Maier <prokurist> <prokurist> Henriette Huber </prokurist> </firma> Wie geht man da vor? Es sollen Adressaufkleber / Anschreiben entstehen, für jeden Prokuristen, am liebsten soll noch erkannt werden "Hans" oder "Hubert" führt zu Anrede Herr ____, "Henriette" oder "Tanja" führt zu Anrede Frau ____, ansonsten "sehr geehrte D&H" erste Frage: Wie klappere ich alle Dateien ab? erledigte können verschoben werden im Dateisystemordner "erledigt", da kopiere ich mir die Dateien lokal. zweite Frage: Wie stelle ich sicher, dass Postadresse mind. Strasse und Hausnummer und Postleitzahl und Ort enthält, Fehlerhafte sollen in einen Dateisystemordner "Nachfragen" verschoben werden. wobei in einer Datei 50 vollständige und 2 unvollständige Adressen drin sein können. Zitieren
allesweg Geschrieben 26. August 2020 Geschrieben 26. August 2020 Geschlecht am Vornamen erkennen: Nein. Gibt es schon eine Serienbrieflösung oder wo entstehen die Anschreiben? Einmalige Aktion oder öfters? Zustimmung zur Adressverwendung / Newsletterversand liegt natürlich vor? Zitieren
0x00 Geschrieben 26. August 2020 Geschrieben 26. August 2020 vor 18 Minuten schrieb allesweg: Geschlecht am Vornamen erkennen: Nein. Ich würde sagen doch. Gibt im Internet genug Listen mit männlichen/weiblichen Vornamen. Ich würde zwei Listen erstellen und alle Einträge, welche in beiden vorhanden sind rauslöschen. Danach evtl. nochmal eine Unisexliste herunterladen und alle dort enthaltenen Namen aus den Listen männlich/weiblich löschen. Wenn ein EIntrag in der Liste ist -> Zuordbar. Wenn nicht -> Manuelle Nachprüfung (evtl. nachträglich in Liste einpflegen) Zitieren
Thanks-and-Goodbye Geschrieben 26. August 2020 Geschrieben 26. August 2020 Was macht ihr bei solchen Listen bei nicht zuordnenbaren Namen? Gibt ja doch nicht wenige Namen, die für Mann und Frau gelten können. Zitieren
0x00 Geschrieben 26. August 2020 Geschrieben 26. August 2020 vor 7 Minuten schrieb Chief Wiggum: Was macht ihr bei solchen Listen bei nicht zuordnenbaren Namen? Gibt ja doch nicht wenige Namen, die für Mann und Frau gelten können. Da es hier um viele Firmen geht, welche nur einmalig angeschrieben werden sollen würde ich mich an ein "Sehr geehrte/r *Unisexname*" halten. Zitieren
KeeperOfCoffee Geschrieben 26. August 2020 Geschrieben 26. August 2020 (bearbeitet) vor 25 Minuten schrieb 0x00: Ich würde sagen doch. Gibt im Internet genug Listen mit männlichen/weiblichen Vornamen. Oder man führt einfach eine weitere Node ein mit M/W/D ... und überhaupt bin ich der Einzige, der es schlecht findet, dass das mit XML von ner CD gemacht wird? Bearbeitet 26. August 2020 von KeeperOfCoffee Zitieren
0x00 Geschrieben 26. August 2020 Geschrieben 26. August 2020 vor 2 Minuten schrieb KeeperOfCoffee: Oder man führt einfach eine weitere Node ein mit M/W/D Wieso anfassen, wenn das eh wahrscheinlich nur einmal benutzt werden soll? Wenn das öfter benutzt werden soll, sollte man sehr stark über ein CRM nachdenken. So oder so ich würde die Finger von den XMLs lassen. vor 2 Minuten schrieb KeeperOfCoffee: ... und überhaupt bin ich der Einzige, der es schlecht findet, dass das mit XML von ner CD gemacht wird? Nein. Zitieren
pr0gg3r Geschrieben 26. August 2020 Geschrieben 26. August 2020 vor 2 Stunden schrieb frfr: erste Frage: Wie klappere ich alle Dateien ab? erledigte können verschoben werden im Dateisystemordner "erledigt", da kopiere ich mir die Dateien lokal. XML-Dateien einlesen und in eine Datenbank importieren. vor 2 Stunden schrieb frfr: zweite Frage: Wie stelle ich sicher, dass Postadresse mind. Strasse und Hausnummer und Postleitzahl und Ort enthält, SQL. vor 2 Stunden schrieb frfr: Fehlerhafte sollen in einen Dateisystemordner "Nachfragen" verschoben werden. SQL. vor 1 Stunde schrieb 0x00: Ich würde sagen doch. Gibt im Internet genug Listen mit männlichen/weiblichen Vornamen. Schon mal mit z.B. Indern zusammengearbeitet? vor einer Stunde schrieb 0x00: Zitat ... und überhaupt bin ich der Einzige, der es schlecht findet, dass das mit XML von ner CD gemacht wird? Nein. +1 0x00 und KeeperOfCoffee reagierten darauf 1 1 Zitieren
MartinSt Geschrieben 26. August 2020 Geschrieben 26. August 2020 (bearbeitet) vor 3 Stunden schrieb 0x00: Gibt im Internet genug Listen mit männlichen/weiblichen Vornamen. Bitte die mal erfolgreich Vorname Name parsen Casimir Johannes Prinz zu Sayn-Wittgenstein-Berleburg Axel Varnbüler von und zu Hemmingen Erika Mustermann MdEP Franz von Hummelauer SJ Stephen Hendry MBE Papst Benedikt XVI. emeritus Andrea Bodelli vs. Andrea Berg Bearbeitet 26. August 2020 von MartinSt Zitieren
Gast frfr Geschrieben 26. August 2020 Geschrieben 26. August 2020 erste Frage: Wie klappere ich alle Dateien ab? erledigte können verschoben werden im Dateisystemordner "erledigt", da kopiere ich mir die Dateien lokal. zweite Frage: Wie stelle ich sicher, dass Postadresse mind. Strasse und Hausnummer und Postleitzahl und Ort enthält, Fehlerhafte sollen in einen Dateisystemordner "Nachfragen" verschoben werden. wobei in einer Datei 50 vollständige und 2 unvollständige Adressen drin sein können. Zitieren
Griller Geschrieben 26. August 2020 Geschrieben 26. August 2020 vor 14 Minuten schrieb frfr: erste Frage: Wie klappere ich alle Dateien ab? erledigte können verschoben werden im Dateisystemordner "erledigt", da kopiere ich mir die Dateien lokal. Hast du schonmal selbst irgendein Programm/Skript erstellt? Dann dürfte das Konzept einer For/Foreach oder While-Schleife ja bekannt sein. vor 15 Minuten schrieb frfr: zweite Frage: Wie stelle ich sicher, dass Postadresse mind. Strasse und Hausnummer und Postleitzahl und Ort enthält, Fehlerhafte sollen in einen Dateisystemordner "Nachfragen" verschoben werden. wobei in einer Datei 50 vollständige und 2 unvollständige Adressen drin sein können. Aufgrund dieses Problems werden die Daten normalerweise in einzelne Felder, z.B. Straße, Hausnummer, PLZ, Ort, aufgesplittet. Wenn du eine so schlechte Datenbasis vorliegen hast ist das "blöd". Zitieren
MartinSt Geschrieben 26. August 2020 Geschrieben 26. August 2020 vor einer Stunde schrieb frfr: Fehlerhafte sollen in einen Dateisystemordner "Nachfragen" verschoben werden. Definiere mal bitte "fehlerhaft". Zitieren
pr0gg3r Geschrieben 26. August 2020 Geschrieben 26. August 2020 vor einer Stunde schrieb frfr: erste Frage: Wie klappere ich alle Dateien ab? https://docs.oracle.com/javase/7/docs/api/java/io/File.html#listFiles(java.io.FileFilter) https://docs.oracle.com/javase/tutorial/essential/io/file.html vor einer Stunde schrieb frfr: zweite Frage: Wie stelle ich sicher, dass Postadresse mind. Strasse und Hausnummer und Postleitzahl und Ort enthält, Fehlerhafte sollen in einen Dateisystemordner "Nachfragen" verschoben werden. wobei in einer Datei 50 vollständige und 2 unvollständige Adressen drin sein können. https://docs.oracle.com/cd/B28359_01/appdev.111/b28394/adx_j_parser.htm https://docs.oracle.com/javase/tutorial/java/nutsandbolts/if.html https://docs.oracle.com/javase/tutorial/essential/io/copy.html allesweg reagierte darauf 1 Zitieren
allesweg Geschrieben 27. August 2020 Geschrieben 27. August 2020 Eine korrekte Postadresse zeichnet sich nicht durch Existenz von Straße, Hausnummer und Ort aus. Zitieren
KeeperOfCoffee Geschrieben 27. August 2020 Geschrieben 27. August 2020 @frfr machst du auch sonst regulär Java? Oder schmeißt dir dein Chef das einfach als Aufgabe auf den Tisch und sagt "machs mit Java"? allesweg reagierte darauf 1 Zitieren
OkiDoki Geschrieben 27. August 2020 Geschrieben 27. August 2020 vor 16 Stunden schrieb allesweg: Zustimmung zur Adressverwendung / Newsletterversand liegt natürlich vor? Ich möchte weiter ergänzen um einige Punkte aus der DSGVO: - Sind die Daten aktuell und wie habt ihr dies sichergestellt? Stichwort: Datenrichtigkeit und Datenaktualität - Habt ihr die Personen über die weitere Nutzung der Daten informiert? Stichwort: Artikel 13&14 DSGVO - Löschkonzepte - u.v.a.m Außerdem gibts für sowas Adressdienstleister. Schickst die .XML Datei hin, die prüfen ob die Personen so existieren und die Daten aktuell sind. Im Zweifel ergänzen diese die Daten auch. Kosten sind relativ gering pro Adresse. allesweg und 0x00 reagierten darauf 2 Zitieren
JimTheLion Geschrieben 27. August 2020 Geschrieben 27. August 2020 vor 13 Minuten schrieb OkiDoki: Außerdem gibts für sowas Adressdienstleister. Schickst die .XML Datei hin, die prüfen ob die Personen so existieren und die Daten aktuell sind. Im Zweifel ergänzen diese die Daten auch. Kosten sind relativ gering pro Adresse. Und nicht vergessen, diesen neuen Vorgang für die DSGVO zu berücksichtigen. vor 17 Stunden schrieb frfr: zweite Frage: Wie stelle ich sicher, dass Postadresse mind. Strasse und Hausnummer und Postleitzahl und Ort enthält, Fehlerhafte sollen in einen Dateisystemordner "Nachfragen" verschoben werden. wobei in einer Datei 50 vollständige und 2 unvollständige Adressen drin sein können. Das von dir gezeigte Format ist murks. Bei solchen Adress-Angaben kannst du nur raten mit welchem Teil der Adresse du gerade arbeitest, spätestens sobald ein Adresszusatz dazu kommt. Das gleiche Problem hast du natürlich auch bei der Anrede. Selbst wenn du Nachnamen gegen Listen mit typischen Frauen- und Männernamen wirfst, Andrea Pirlo wird das Vorgehen nicht gefallen. Wo kommen die Daten denn her? Kann man das Format noch ändern? Mit einem vernünftigen Format würde ich so vorgehen: Schema-Datei erstellen um zu prüfen ob die jeweiligen Dateien überhaupt dem vereinbarten Format entsprechen Weitere Schema-Datei um auf Datensatzebene Fehler zu finden und Identifikationsmerkmale für fehlerhafte Datensätze zurückzugeben Die nächsten Schritte hängen davon ab was mit den Daten als nächstes passieren soll: XSL-Dateien erstellen um aus der Ursprungs-XML zwei neue Dateien zu generieren um die fehlerhaften Datensätze einfach in eine fehler.xml zu packen, dabei werden die Datensätze auf die Identifikationsmerkmale der Schema-Datei gefiltert um die korrekten Datensätze rauszufiltern und in eine neue xml zu packen, je nach Anwendungszweck kann man die Daten dabei auch gleich umformen, z.B. ins CSV-Format oder w/e Wenn man FOP anbindet, könnte man an dieser Stelle auch direkt die Anschreiben erstellen Wenn man keinen Bock darauf hat, ließe sich die XML bestimmt auch per Java bearbeiten, das habe ich aber als recht umständlich in Erinnerung - bin aber auch nicht den Umgang mit Java und den XSLT-Bibliotheken gewohnt. Zitieren
Gast frfr Geschrieben 27. August 2020 Geschrieben 27. August 2020 Mein Arbeitgeber hat einen Datenschutzbeautragten, Mein Arbeitgeber ist eine Körperschaft öffentlichen Rechts. Wir haben Mitglieder, die wollen wir für neue Sachen ansprechen, die später dann für alle Mitglieder relevant sein können. Ein CRM ist noch pre-alpha, der Dienstleister bricht sich selbst alle Finger, wiederholt, die pre-alpha-Test-Datenbank ist unter 2 GB gross, aber die Debug-Datenbank dazu ist 80 GB und stark wachsend (kein Staging). Kenn ich so nicht, aber egal. Warum die Datenbank im simple-recovery-Modell fährt, aber die Debug-Datenbank im Full-recovery-Model ist ein Rätsel der Menschheit. Zitieren
allesweg Geschrieben 27. August 2020 Geschrieben 27. August 2020 Und was hat das mit deinem Ausgangsposting zu tun? Nochmals: vor 17 Stunden schrieb allesweg: Gibt es schon eine Serienbrieflösung oder wo entstehen die Anschreiben? Einmalige Aktion oder öfters? Oder geht es nur darum, dass du Java programmierst? Zitieren
Gast frfr Geschrieben 27. August 2020 Geschrieben 27. August 2020 mir geht es um die Java-Programmierung, das Eintüten der Broschüren übernimmt jemand anders. Und Datenschützer ist auch jemand anders. Ich mach sonst Windows-Server-Kram, und Java ist einfach die einzig erlaubte Programmiersprache. Zitieren
allesweg Geschrieben 27. August 2020 Geschrieben 27. August 2020 Dann steht alles relevante im Post von @pr0gg3r. Zitieren
pr0gg3r Geschrieben 27. August 2020 Geschrieben 27. August 2020 Um nochmal Hilfestellung zu geben (@frfr: hast du denn Erfahrung im Programmieren?): Die Logik müsste so aussehen: Auflisten aller Dateien aus einem Ordner (in etwa so) Einlesen der einzelnen XML-Dateien (in etwa so) If notwendige Felder vorhanden: Datei in Ordner "erledigt" kopieren (in etwa so) else: Datei in Ordner "Nachfragen" kopieren Fang einfach mal mit Schritt 1. an und liste alle Dateien in der Console auf. Wenn du hier Probleme hast: nachfragen. 0x00 reagierte darauf 1 Zitieren
Empfohlene Beiträge
Dein Kommentar
Du kannst jetzt schreiben und Dich später registrieren. Wenn Du ein Konto hast, melde Dich jetzt an, um unter Deinem Benutzernamen zu schreiben.