Zum Inhalt springen

VB.net - Word-formatierung aus texten entfernen


jasso

Empfohlene Beiträge

Hallo leute,

folgendes Problem liegt vor: es werden texte aus Word in ein (nicht von mir entwickeltes) Programm eingegeben und in einer db gespeichert. dummerweise werden die Word-Formatierungsangaben als Text mitkopiert und in der DB gespeichert. ich soll nun diese Strings auslesen und alle formatangaben herauslöschen um nur den reinen text zu bekommen.

weiß jemand dafür eine Umwandlungs-Klasse oder eine feste definition anhand derer ich Word-Formatangaben erkennen kann?

danke

lg

jasso

Link zu diesem Kommentar
Auf anderen Seiten teilen

der word-text wird von verschiedenen kunden in ein programm eingegeben und auch von dem programm in der db gespeichert.

ich habe leider nicht die möglichkeit allen kunden zu sagen dass sie den word-text vorher in den editor und dann vom editor in das programm kopieren sollen.

jetzt soll ich nach möglichkeit die felder der db nachträglich bearbeiten.

lg

jasso

Link zu diesem Kommentar
Auf anderen Seiten teilen

du könntest ja via automatisierung auf das dokumentmodell der einzulesenden datei zugreifen und dort z.b. nur die paragraphs- oder alle benannten abschnitte auslesen - das hängt aber davon ab, wie dein dokument aufgebaut ist. word 2003 kann dokumente z.b. als XML speichern, dies wäre eine möglichkeit; oder aber eben über die automatisierung/interop von VB.NET:

Dim oPara As Microsoft.Office.Interop.Word.Paragraph

oPara = WordDoc.Content.Paragraphs...

s'Amstel

Link zu diesem Kommentar
Auf anderen Seiten teilen

der word-text wird von verschiedenen kunden in ein programm eingegeben und auch von dem programm in der db gespeichert.
Die Frage ist doch, warum das Programm überhaupt die Formatierungen annimmt, wenn es nur unformatierten Text verarbeiten soll.

jetzt soll ich nach möglichkeit die felder der db nachträglich bearbeiten.
Wie sehen diese Formatangaben denn aus? RTF? Zeig mal ein Beispiel.
Link zu diesem Kommentar
Auf anderen Seiten teilen

hmmm ... ich glaube mein problem ist noch nicht ganz richtig rübergekommen.

ich habe keine möglichkeit das kopieren durch den kunden aus word zu beeinflussen. der kunde wird weiterhin im word seine texte kopieren und in sein programm übertragen, wodurch ich auf jeden fall die word-texte inclusive den formatierungen in textform in der db stehen habe.

was ich nun benötigen würde wäre eine klasse oder definition zum filtern dieser texte und löschen der textuell dargestellten word-formatierungen.

Edit.: beispiel folgt gleich.

lg

jasso

Edit. Nr.2: ok ... danke für eure mühen leute. mir wurde gerade mitgeteilt dass es sich bei den angeblichen format-angaben nicht um word-formatierungen handelt, sondern die verunstaltung des textes durch das kopieren aus einer citrix-remotesitzung entstehen. (ich hoffe dass es dabei bleibt. wenn nicht meld ich mich nochmal :hells: )

Link zu diesem Kommentar
Auf anderen Seiten teilen

Dein Kommentar

Du kannst jetzt schreiben und Dich später registrieren. Wenn Du ein Konto hast, melde Dich jetzt an, um unter Deinem Benutzernamen zu schreiben.

Gast
Auf dieses Thema antworten...

×   Du hast formatierten Text eingefügt.   Formatierung wiederherstellen

  Nur 75 Emojis sind erlaubt.

×   Dein Link wurde automatisch eingebettet.   Einbetten rückgängig machen und als Link darstellen

×   Dein vorheriger Inhalt wurde wiederhergestellt.   Editor leeren

×   Du kannst Bilder nicht direkt einfügen. Lade Bilder hoch oder lade sie von einer URL.

Fachinformatiker.de, 2024 by SE Internet Services

fidelogo_small.png

Schicke uns eine Nachricht!

Fachinformatiker.de ist die größte IT-Community
rund um Ausbildung, Job, Weiterbildung für IT-Fachkräfte.

Fachinformatiker.de App

Download on the App Store
Get it on Google Play

Kontakt

Hier werben?
Oder sende eine E-Mail an

Social media u. feeds

Jobboard für Fachinformatiker und IT-Fachkräfte

×
×
  • Neu erstellen...