Valentin Geschrieben 3. Mai 2007 Teilen Geschrieben 3. Mai 2007 Hallo alle beisammen, ich muss Daten (Name, Vorname, Datum1, Datum2, Ort1 etc.) aus den Datenfiles des Programms "InfoPilot" der SHI-GmbH extrahieren (http://www.shi-gmbh.de). Die CD ist die digitale Version des Gedenkbuchs Koblenz, und die Daten der Opfer sollen mit einer größeren Datenbank Synchronisiert werden. Die Zieldatenbank ist in Filemaker. Wenn ich Tab getrennte Daten rausbekomme sollten das also funktionieren. SHI sagt, die Daten sind in sogenannten "XML-Compilations" abgelegt, leider kann ich damit garnichts anfangen. Das Bundesarchiv konnte uns die Daten leider in keinem andern Format besorgen. Für (schnelle) Hilfe wäre ich euch sehr dankbar. MfG Valentin Zitieren Link zu diesem Kommentar Auf anderen Seiten teilen Mehr Optionen zum Teilen...
baba007 Geschrieben 3. Mai 2007 Teilen Geschrieben 3. Mai 2007 compilation bedeutet einfach nur Sammlungvon xml files. du brauchst jetzt nur die geeigneten parser. ich tippe mal auf je tabelle, ein xml file Zitieren Link zu diesem Kommentar Auf anderen Seiten teilen Mehr Optionen zum Teilen...
Valentin Geschrieben 3. Mai 2007 Autor Teilen Geschrieben 3. Mai 2007 Gibt es den Programme die mir weiterhelfen könnten ? Es sind ca. 8-11 Dateien im Daten-Ordner (10-167MB) Danke für die Mühe Zitieren Link zu diesem Kommentar Auf anderen Seiten teilen Mehr Optionen zum Teilen...
baba007 Geschrieben 4. Mai 2007 Teilen Geschrieben 4. Mai 2007 soweit ich es bisher gelernt habe, wirst du nicht drumkommen ein skript zu schreiben um die informationen auszulesen. wenn du die XML-Schemas hast, ist es eigentlich nur eine fleissarbeit zwar kann z.B. access ein xml file importieren jedoch entstehen sehr viele fehler. Zitieren Link zu diesem Kommentar Auf anderen Seiten teilen Mehr Optionen zum Teilen...
Valentin Geschrieben 5. Mai 2007 Autor Teilen Geschrieben 5. Mai 2007 Hmmmm, auf einem Mac, habe ich mir sagen lassen, rippt "file juicer (http://www.echoone.com/filejuicer/)" die einzelnen Datensätze und gibt sie als HTML-File (ein Datensatz pro Datei) aus. Leider habe ich keinen Mac und kann das nicht nachmachen (würde auch ewig dauern, ein 2 Jahre alter Mac hatte nach 36 Stunden gerade mal 10.000 Dateien geschrieben [sind ca. 160.000]). Dann könnte ich einfach html2txt | cat irgendwas > Daten.txt bashen. Leider reichen meine Linux-Kenntnisse für "advanced" bash-scripting nicht aus. Vielleicht könnte man auch irgendeinen Windows Resource-Hacker automatisieren, filejuicer schein ja nichts anderes zu sein. Nochmals danke für die Hinweise, sollte aber irgendjemand einen guten viewer/editor kennen (ähnlich Scite), der _leicht_ einmal definierte Aktionen (bitte ohne zu viel Programmierkenntnisse) im Sinne von Stapelfunktionen beherrscht, würde ich mich über jeden Hinweis freuen Nochmals danke Zitieren Link zu diesem Kommentar Auf anderen Seiten teilen Mehr Optionen zum Teilen...
Empfohlene Beiträge
Dein Kommentar
Du kannst jetzt schreiben und Dich später registrieren. Wenn Du ein Konto hast, melde Dich jetzt an, um unter Deinem Benutzernamen zu schreiben.