DFBL-Benjamin Geschrieben 19. Juni 2005 Geschrieben 19. Juni 2005 wer kennt ein Tool, womit man PDF-DAteien umwandeln lassen kann, in das TXT-Format? wenn ich das mit ACROBAT-REader mache, dann werden einfach mal Leerstellen eingefügt, wo in der PDF-DAtei nicht sind. Da sind die Uhrzeit zusammen geschrieben, aber dann in der TXT-Datei sieht dass dann so aus: 19: 00 und das wäre dann 2 Arrays, statt 1! HOffe, jemand kennt ein sehr einfaches Tool, womit man PDF-Dateien umwandeln lassen kann. Zitieren
Thanks-and-Goodbye Geschrieben 19. Juni 2005 Geschrieben 19. Juni 2005 Wie wandelst du denn mit welchem Reader auf welchem Betriebssystem pdf in txt um? Der Reader ist ein reiner Viewer. Verarbeitungsfunktionen hat der nicht. Mit der Board-Suchfunktion lassen sich solche Sachen auch finden. http://forum.fachinformatiker.de/showthread.php?t=78909 http://forum.fachinformatiker.de/showthread.php?t=59049 Zitieren
DFBL-Benjamin Geschrieben 19. Juni 2005 Autor Geschrieben 19. Juni 2005 ich habe WinXP und habe ACROBAT 5.0! ich habs mit der Funktion dort umgewandelt, aber da werden bei zusammenhängenden Sachen, wie der Uhrzeit, einfach ein Leerzeichen eingefügt. deshalb bin ich jetzt auf der Suche nach einem anderen Tool, wo das nicht macht! habe bis jetzt noch nichts gefunden, wo mich weiterbringt! ich habe schon einige Heruntergeladen, aber bis jetzt hat nur eins überzeugt, das nur über die Konsole läuft. Das ist recht umständlich! Zitieren
Thanks-and-Goodbye Geschrieben 19. Juni 2005 Geschrieben 19. Juni 2005 wenn ich das mit ACROBAT-REader mache... ich habe WinXP und habe ACROBAT 5.0!Könntest du dich bitte mal drauf einigen und deutlich schreiben, welche Version vom Acrobat du verwendest? Acrobat Reader oder die Vollversion, die auch *.pdf erstellen kann? Aus welcher Quellanwendung kommen denn die Daten? Also die Ursprungsdatei, die dann in *.pdf umgewandelt wurde? Zitieren
Schledo Geschrieben 19. Juni 2005 Geschrieben 19. Juni 2005 Wie wandelst du denn mit welchem Reader auf welchem Betriebssystem pdf in txt um? Der Reader ist ein reiner Viewer. Verarbeitungsfunktionen hat der nicht. Nicht ganz richtig, man hat im Reader auch ein Textmarkierung und kann über die Zwischenablage Text in ein Dokument, z.B. txt-Datei, kopieren. Ich denke genau dies will er automatisiert realisieren bzw. zu verwenden. Zitieren
speedi Geschrieben 20. Juni 2005 Geschrieben 20. Juni 2005 ich habe schon einige Heruntergeladen, aber bis jetzt hat nur eins überzeugt, das nur über die Konsole läuft. Das ist recht umständlich! Also: Du sagst du hast ein Programm das recht gut Funktioniert dir aber von der Benutzeroberfläche zu kompliziert ist. Wenn das Ding shareware oder freeware oder irgendsowas ist was man legal untereinander tauschen kann dann kannst mir das gern mal schicken und ich mach dir mit JAVA (falls JAVA auf deinen PC läuft) ne Benutzerobefläche dazu. Dürfte nicht wirklich kein Problem sein. Zitieren
Thanks-and-Goodbye Geschrieben 20. Juni 2005 Geschrieben 20. Juni 2005 Nicht ganz richtig, man hat im Reader auch ein Textmarkierung und kann über die Zwischenablage Text in ein Dokument, z.B. txt-Datei, kopieren.Ja, das geht, aber nicht immer sauber. Was bei mir Unklarheiten hervorruft ist:ich habs mit der Funktion dort umgewandelt...Solange nicht klar ist, wie der Export durchgeführt wird, kann eine Fehlersuche nicht stattfinden. Zitieren
Thorsten Schröder Geschrieben 20. Juni 2005 Geschrieben 20. Juni 2005 Hallo DFBL-Benjamin, Du könntest z.B. mal Ghostview nehmen, damit die pdf Datei öffnen, unter Bearbeiten Text extrahieren anwählen, die gewünschten Seiten auswählen und im darauf folgendem Dialogfenster die neue Datei mit .txt abspeichern. Die aktuelle Version kannst Du kannst Dir hier kostenlos downloaden: http://www.cs.wisc.edu/~ghost/ Zitieren
DFBL-Benjamin Geschrieben 21. Juni 2005 Autor Geschrieben 21. Juni 2005 Die Informationen von der PDF-Dateien stammen von einer Internetseite, wo ich die Seite dann als PDF ausdrucken lasse, also mit der Vollversion von Acrobat 5.0. Damit lasse ich die PDF-Datei über das Druckprotokoll DISTILLER erzeugen. Da ich eine PDF-Datei nicht weiterverarbeiten kann, möchte ich es in eine TXT-Datei umwandeln lassen. Da gibt es sehr viele verschiedene Möglichkeiten, bloß bei jedem sieht das anders aus. Deshalb bin ich halt noch auf der Suche nach der besten Lösung für mich. Die Daten aus der TXT-Datei möchte ich dann mit PHP einlesen lassen und dann weiterverarbeiten. gibt es noch andere Möglichkeiten eine HTML-Seite direkt in eine TXT-DAtei umwandeln zu lassen. Dann kann ich mir den Zwischenschritt mit der PDF-DAtei sparen. DAs wäre auch nicht schlecht. Ich hoffe, dass die Version jetzt klar ist. Ich habe die ACROBAT Vollversion 5.0! Damit bearbeite ich die PDF-Dateien, oder kann es auch in eine TXT-Datei umwandeln lassen, bloß sauber macht er das nicht! hoffe jemand kennt noch ein anderes Programm. danke! Zitieren
allesweg Geschrieben 21. Juni 2005 Geschrieben 21. Juni 2005 Würde da nicht die simple Einrichtung eines generic-text-druckers mit Ausgabe in Datei reichen? *mutmaße mangels testmöglichkeit* ach und dann ist das Topic ja wohl "Umwandlung html --> txt" :mod: Zitieren
DFBL-Benjamin Geschrieben 21. Juni 2005 Autor Geschrieben 21. Juni 2005 davon habe ich noch nie was gehört! wo gibt es dazu Programme? werde gleich mal mit Google, das Wörtchen eingeben. Das mit Ghostview funktioniert bei mir nicht. Ich bekomme immer FEHLERmeldungen. Was muss ich denn da installieren? Zitieren
hellslawyer Geschrieben 21. Juni 2005 Geschrieben 21. Juni 2005 In diesem Fall ist es doch viel einfacher, wenn man beispielsweise im Internet Explorer einfach unter Datei -> Speichern unter die Option "Nur Text (.txt)" auswählt. Datei benennen und schwuppdiwupp da ist ne reine TXT. Grütze hellslawyer Zitieren
Crush Geschrieben 21. Juni 2005 Geschrieben 21. Juni 2005 Es gab für den Acrobat-Reader auf der HP irgendwo versteckt ein Plugin, welches den Text in .txt oder evtl. sogar .doc-Format abspeichern konnte. Zitieren
DFBL-Benjamin Geschrieben 22. Juni 2005 Autor Geschrieben 22. Juni 2005 bloß ich benutze keinen Internet Explorer nur Firefox. Ich werde das mit dem Druckprotokoll machen. Habe mir die Darstellung noch nicht so 100% angeschaut, aber sollte passen. wenn die Darstellung nicht passen sollte, dann melde ich mich wieder! Zitieren
DFBL-Benjamin Geschrieben 22. Juni 2005 Autor Geschrieben 22. Juni 2005 ich habe jetzt festgestellt, dass das mit dem Druckprotokoll alles durcheinander gerät in der Zeile. Wenn ich es jetzt die einzelne Zeile abgespeichert habe und dann die einzelne Zeile aufteilen will, also jede Leerstelle, dann funktioniert das nicht. gibt es für diesen Vorgang noch andere TXT-Drucker? oder sonstige Programme, wo ich dann von einer Internetseite eine TXT-Datei erzeugen lassen kann? ich benutze den Firefox-Browser! Vielleicht gibt es dazu Plugins? werde mal nachschauen, aber vielleicht kennt ja schon jemand einen, dann her damit. DANKE! Zitieren
Thorsten Schröder Geschrieben 22. Juni 2005 Geschrieben 22. Juni 2005 Hallo DFBL-Benjamin, also möchtest Du nun von PDF zu TXT oder z.B. HTML zu TXT? Von PDF zu TXT geht es bei mir wunderbar auch mit Ghostview. Von einer Internetseite zu TXT geht die vorgeschlagene Variante von hellslawyer; sieht allerdings so aus, als ob dieses nicht nach Deinen Wünschen ist. Also suchst Du vielleicht so etwas ?: http://www.jafsoft.com/detagger/index.html Dort kannst Du eine Internetseite in eine Text Datei umwandeln. Zitieren
DFBL-Benjamin Geschrieben 22. Juni 2005 Autor Geschrieben 22. Juni 2005 Hallo DFBL-Benjamin, also möchtest Du nun von PDF zu TXT oder z.B. HTML zu TXT? Von PDF zu TXT geht es bei mir wunderbar auch mit Ghostview. Von einer Internetseite zu TXT geht die vorgeschlagene Variante von hellslawyer; sieht allerdings so aus, als ob dieses nicht nach Deinen Wünschen ist. Also suchst Du vielleicht so etwas ?: http://www.jafsoft.com/detagger/index.html Dort kannst Du eine Internetseite in eine Text Datei umwandeln. Hallo das Programm JAFSOFT übersetzt leider auch nicht alles so wie ich das gerne hätte. kannst du mir mal erklären, was ich alles für GHOSTview installieren muss, dass der läuft? am besten direkt mit Download-Link für die SACHEN, was ich installieren muss. ich bekomme beim Installieren des GHOSTVIEW folgende Fehlermeldung: "Error 0 running command .\setup.exe". Was mache ich denn falsch? Dabei habe ich das Programm ftp://mirror.cs.wisc.edu/pub/mirrors/ghost/ghostgum/gsv47w64.exe runtergeladen. Ist dass das richtige, was sonst? Zitieren
Thanks-and-Goodbye Geschrieben 22. Juni 2005 Geschrieben 22. Juni 2005 Zu Ghostscript Installationsproblemen bitte einen eigenständigen Thread eröffnen! Zitieren
DFBL-Benjamin Geschrieben 22. Juni 2005 Autor Geschrieben 22. Juni 2005 ich mache das jetzt anders! so wie es hellslawyer gesagt hat, ist es glaube ich am einfachsten und die Darstellung ist OK! jetzt muss ich nur noch die Daten in eine Form bringen, dass ich es weiter verarbeiten und in eine Datenbank eintragen kann. Zitieren
Empfohlene Beiträge
Dein Kommentar
Du kannst jetzt schreiben und Dich später registrieren. Wenn Du ein Konto hast, melde Dich jetzt an, um unter Deinem Benutzernamen zu schreiben.