Zum Inhalt springen

Empfohlene Beiträge

Geschrieben

Hi, Leute.

Ich würde gern mal wissen, ob es ein Programm (Parser) gibt, das mir aus einer .DOC (Word 2000) Webseiten erzeugen kann.

Dabei meine ich nicht den eingebauten Algorythmus, der mir eine Seite mit extrem unübersichtlichen MS-Styles erstellt.

Ich hätte gern von jeder Überschrift eine HTML-Seite und wenn möglich das Inhaltsverzeichnis auf der Indexseite, ist aber nicht umbedingt erforderlich.

Hintergrund ist, dass ich für ein Programm eine F1-Kontexthilfe erstellen soll, als Grundlage daführ nehme ich das Handbuch (das ich auch erstelle und sich noch weiterentwickelt).

Währe für jeden Tipp dankbar.

Hmm, so ein Parser wäre doch auch mal was für ein Abschlussprojekt, oder?

Geschrieben

Hm,

solch ein Programm wüsste ich jetzt nicht. Was du aber machen kannst, wäre die Word-Dateien in xml, sprich Word-MLzu speichern und über ein xslt in HTML zu layouten.

Gruß,

Honky

Geschrieben

Leider kann Word 2000 kein XML, trotzdem danke.

aber ich könnte es ja mal schnell in StarOffice übertragen und als odt speichern, dann ist es ja schon xml.

Ich probier das mal.

Geschrieben
Hmm, so ein Parser wäre doch auch mal was für ein Abschlussprojekt, oder?
Naja,

dank des so offenen doc-Formats mit Sicherheit nicht so einfach...ansonsten wär das mal was :)

Aber du hast ja schon die Lösung...Open/StarOffice -> xml -> parsen/xslt -> html.

Geschrieben

Ich habe hier ein sehr gutes Tool gefunden, dass mir zwar nicht aus Word aber aus PDF Dateien HTML-Files erzeugen kann. Und die sehen sogar fast so gut aus wie die PDFs. da es ja nun kein Problem ist Word in PDF zu Parsen (Über Acrobat Distiller oder XPDF) war das dann auch kein großes Ding mehr.

Allerdings gibt es noch ein paar kleine Bugs, weswegen man vorher vielleicht eine Abgespeckte Version (Meine hat 30 neu definierte Absatzformate in der Vorlage) für das Web erzeugen sollte. Das Tool kann pro PDF-Seite eine HTML-Seite erzeugen, und erzeugt dann auf der Webseite einen Frame über den man zwischen den Seiten Blättern kann.

Guckt es euch einfach auch mal an. ich finds klasse.

http://guiguy.wminds.com/downloads/pdf2htmlgui/down.html

Geschrieben

Ich meinte Richtige HTML-Dokumente und nicht diesen Mircrosoft Mist :)

Es stimmt zwar, dass man mit Word auch HTML erzeugen kann, aber leider halten die sich nicht an den Stadard und auch extrem schwer zu lesen, geschweige denn zu korrigieren. Und bevor ich mir von Word eine Webseite aus einem Worddokument mit ca. 100 Seiten erstellen lasse, schreibe ich die lieber von Hand.

Geschrieben

macromedias dreamweaver 4 / MX haben eine funktion zum bereinigen von word-html, welches alle tags entfern und fast W3C-konforme .html's erstellt. es sollte noch eine testversion davon geben.

s'Amstel

Geschrieben

Ja, stimmt. das werde ich bei gelegenheit mal testen. da ich jetzt aber schon angefangen habe den auswurf von meinem Tip oben per Hand zu bearbeiten, werde ich es wohl nicht mehr im Projekt verwenden. Aber danke für den Tip.

Macht ja auch mal wieder Spaß in HTML zu proggen.

Erstelle ein Benutzerkonto oder melde Dich an, um zu kommentieren

Du musst ein Benutzerkonto haben, um einen Kommentar verfassen zu können

Benutzerkonto erstellen

Neues Benutzerkonto für unsere Community erstellen. Es ist einfach!

Neues Benutzerkonto erstellen

Anmelden

Du hast bereits ein Benutzerkonto? Melde Dich hier an.

Jetzt anmelden

Fachinformatiker.de, 2024 by SE Internet Services

fidelogo_small.png

Schicke uns eine Nachricht!

Fachinformatiker.de ist die größte IT-Community
rund um Ausbildung, Job, Weiterbildung für IT-Fachkräfte.

Fachinformatiker.de App

Download on the App Store
Get it on Google Play

Kontakt

Hier werben?
Oder sende eine E-Mail an

Social media u. feeds

Jobboard für Fachinformatiker und IT-Fachkräfte

×
×
  • Neu erstellen...