jasso Geschrieben 20. November 2006 Teilen Geschrieben 20. November 2006 Hallo leute, folgendes Problem liegt vor: es werden texte aus Word in ein (nicht von mir entwickeltes) Programm eingegeben und in einer db gespeichert. dummerweise werden die Word-Formatierungsangaben als Text mitkopiert und in der DB gespeichert. ich soll nun diese Strings auslesen und alle formatangaben herauslöschen um nur den reinen text zu bekommen. weiß jemand dafür eine Umwandlungs-Klasse oder eine feste definition anhand derer ich Word-Formatangaben erkennen kann? danke lg jasso Zitieren Link zu diesem Kommentar Auf anderen Seiten teilen Mehr Optionen zum Teilen...
Klotzkopp Geschrieben 20. November 2006 Teilen Geschrieben 20. November 2006 Wie und wohin wird denn "eingegeben"? Zitieren Link zu diesem Kommentar Auf anderen Seiten teilen Mehr Optionen zum Teilen...
jasso Geschrieben 20. November 2006 Autor Teilen Geschrieben 20. November 2006 der word-text wird von verschiedenen kunden in ein programm eingegeben und auch von dem programm in der db gespeichert. ich habe leider nicht die möglichkeit allen kunden zu sagen dass sie den word-text vorher in den editor und dann vom editor in das programm kopieren sollen. jetzt soll ich nach möglichkeit die felder der db nachträglich bearbeiten. lg jasso Zitieren Link zu diesem Kommentar Auf anderen Seiten teilen Mehr Optionen zum Teilen...
Amstelchen Geschrieben 20. November 2006 Teilen Geschrieben 20. November 2006 du könntest ja via automatisierung auf das dokumentmodell der einzulesenden datei zugreifen und dort z.b. nur die paragraphs- oder alle benannten abschnitte auslesen - das hängt aber davon ab, wie dein dokument aufgebaut ist. word 2003 kann dokumente z.b. als XML speichern, dies wäre eine möglichkeit; oder aber eben über die automatisierung/interop von VB.NET: Dim oPara As Microsoft.Office.Interop.Word.Paragraph oPara = WordDoc.Content.Paragraphs... s'Amstel Zitieren Link zu diesem Kommentar Auf anderen Seiten teilen Mehr Optionen zum Teilen...
Klotzkopp Geschrieben 20. November 2006 Teilen Geschrieben 20. November 2006 der word-text wird von verschiedenen kunden in ein programm eingegeben und auch von dem programm in der db gespeichert.Die Frage ist doch, warum das Programm überhaupt die Formatierungen annimmt, wenn es nur unformatierten Text verarbeiten soll. jetzt soll ich nach möglichkeit die felder der db nachträglich bearbeiten.Wie sehen diese Formatangaben denn aus? RTF? Zeig mal ein Beispiel. Zitieren Link zu diesem Kommentar Auf anderen Seiten teilen Mehr Optionen zum Teilen...
jasso Geschrieben 20. November 2006 Autor Teilen Geschrieben 20. November 2006 hmmm ... ich glaube mein problem ist noch nicht ganz richtig rübergekommen. ich habe keine möglichkeit das kopieren durch den kunden aus word zu beeinflussen. der kunde wird weiterhin im word seine texte kopieren und in sein programm übertragen, wodurch ich auf jeden fall die word-texte inclusive den formatierungen in textform in der db stehen habe. was ich nun benötigen würde wäre eine klasse oder definition zum filtern dieser texte und löschen der textuell dargestellten word-formatierungen. Edit.: beispiel folgt gleich. lg jasso Edit. Nr.2: ok ... danke für eure mühen leute. mir wurde gerade mitgeteilt dass es sich bei den angeblichen format-angaben nicht um word-formatierungen handelt, sondern die verunstaltung des textes durch das kopieren aus einer citrix-remotesitzung entstehen. (ich hoffe dass es dabei bleibt. wenn nicht meld ich mich nochmal :hells: ) Zitieren Link zu diesem Kommentar Auf anderen Seiten teilen Mehr Optionen zum Teilen...
Empfohlene Beiträge
Dein Kommentar
Du kannst jetzt schreiben und Dich später registrieren. Wenn Du ein Konto hast, melde Dich jetzt an, um unter Deinem Benutzernamen zu schreiben.