isardor Geschrieben 28. März 2006 Geschrieben 28. März 2006 Hi, Leute. Ich würde gern mal wissen, ob es ein Programm (Parser) gibt, das mir aus einer .DOC (Word 2000) Webseiten erzeugen kann. Dabei meine ich nicht den eingebauten Algorythmus, der mir eine Seite mit extrem unübersichtlichen MS-Styles erstellt. Ich hätte gern von jeder Überschrift eine HTML-Seite und wenn möglich das Inhaltsverzeichnis auf der Indexseite, ist aber nicht umbedingt erforderlich. Hintergrund ist, dass ich für ein Programm eine F1-Kontexthilfe erstellen soll, als Grundlage daführ nehme ich das Handbuch (das ich auch erstelle und sich noch weiterentwickelt). Währe für jeden Tipp dankbar. Hmm, so ein Parser wäre doch auch mal was für ein Abschlussprojekt, oder? Zitieren
Honkytonk Geschrieben 28. März 2006 Geschrieben 28. März 2006 Hm, solch ein Programm wüsste ich jetzt nicht. Was du aber machen kannst, wäre die Word-Dateien in xml, sprich Word-MLzu speichern und über ein xslt in HTML zu layouten. Gruß, Honky Zitieren
isardor Geschrieben 28. März 2006 Autor Geschrieben 28. März 2006 Leider kann Word 2000 kein XML, trotzdem danke. aber ich könnte es ja mal schnell in StarOffice übertragen und als odt speichern, dann ist es ja schon xml. Ich probier das mal. Zitieren
schlati Geschrieben 28. März 2006 Geschrieben 28. März 2006 Hmm, so ein Parser wäre doch auch mal was für ein Abschlussprojekt, oder?Naja, dank des so offenen doc-Formats mit Sicherheit nicht so einfach...ansonsten wär das mal was Aber du hast ja schon die Lösung...Open/StarOffice -> xml -> parsen/xslt -> html. Zitieren
isardor Geschrieben 29. März 2006 Autor Geschrieben 29. März 2006 Ich habe hier ein sehr gutes Tool gefunden, dass mir zwar nicht aus Word aber aus PDF Dateien HTML-Files erzeugen kann. Und die sehen sogar fast so gut aus wie die PDFs. da es ja nun kein Problem ist Word in PDF zu Parsen (Über Acrobat Distiller oder XPDF) war das dann auch kein großes Ding mehr. Allerdings gibt es noch ein paar kleine Bugs, weswegen man vorher vielleicht eine Abgespeckte Version (Meine hat 30 neu definierte Absatzformate in der Vorlage) für das Web erzeugen sollte. Das Tool kann pro PDF-Seite eine HTML-Seite erzeugen, und erzeugt dann auf der Webseite einen Frame über den man zwischen den Seiten Blättern kann. Guckt es euch einfach auch mal an. ich finds klasse. http://guiguy.wminds.com/downloads/pdf2htmlgui/down.html Zitieren
volker81 Geschrieben 29. März 2006 Geschrieben 29. März 2006 Wenn du bei Office die Web-Extensions installiert hast, kannst du Dokumente auch als HTML speichern. Zitieren
isardor Geschrieben 29. März 2006 Autor Geschrieben 29. März 2006 Ich meinte Richtige HTML-Dokumente und nicht diesen Mircrosoft Mist Es stimmt zwar, dass man mit Word auch HTML erzeugen kann, aber leider halten die sich nicht an den Stadard und auch extrem schwer zu lesen, geschweige denn zu korrigieren. Und bevor ich mir von Word eine Webseite aus einem Worddokument mit ca. 100 Seiten erstellen lasse, schreibe ich die lieber von Hand. Zitieren
Amstelchen Geschrieben 29. März 2006 Geschrieben 29. März 2006 macromedias dreamweaver 4 / MX haben eine funktion zum bereinigen von word-html, welches alle tags entfern und fast W3C-konforme .html's erstellt. es sollte noch eine testversion davon geben. s'Amstel Zitieren
isardor Geschrieben 4. April 2006 Autor Geschrieben 4. April 2006 Ja, stimmt. das werde ich bei gelegenheit mal testen. da ich jetzt aber schon angefangen habe den auswurf von meinem Tip oben per Hand zu bearbeiten, werde ich es wohl nicht mehr im Projekt verwenden. Aber danke für den Tip. Macht ja auch mal wieder Spaß in HTML zu proggen. Zitieren
Empfohlene Beiträge
Dein Kommentar
Du kannst jetzt schreiben und Dich später registrieren. Wenn Du ein Konto hast, melde Dich jetzt an, um unter Deinem Benutzernamen zu schreiben.