Zum Inhalt springen

HTML-Documentparser


Empfohlene Beiträge

Geschrieben

Hallo,

habe ein Problem:

ich möchte gern einen Programm schreiben mit dem ich aus einem HTML-Dokument bestimmte Elementinhalte rauslesen kann.

Zum Beispiel:

lese inhalt aus dem "<a> Tag" od.

speicher mir alle "<a> Tags" in einem Map usw.

Hat jemand einen Tipp welche Packages ich anschauen soll.

Bitte nicht mit Reguläre Ausdrücke anfangen!

Thx

Geschrieben

Wie bitttttteeeeeee ???????????????????? :confused: :confused: :confused: :confused: :confused:

Theoretisch würde es schon gehen aber das dauert ja ewig, wenn ich byte für byte mich durch das Dokument (die Dokumente) kämpfen müsste. :P

Hab scho ne Lösung gefunden.

JTidy heisst das Zauberwort.

Trotzdem Danke.

Geschrieben

Wenn ihr mal einen richtigen HTML Parser braucht, dann könnt ihr euch sowas mit ANTLR (einem Parser-Generator ) machen (www.antlr.org).

Für HTML ist sogar ein Beispiel dabei, wenn ich mich nicht irre.

Erstelle ein Benutzerkonto oder melde Dich an, um zu kommentieren

Du musst ein Benutzerkonto haben, um einen Kommentar verfassen zu können

Benutzerkonto erstellen

Neues Benutzerkonto für unsere Community erstellen. Es ist einfach!

Neues Benutzerkonto erstellen

Anmelden

Du hast bereits ein Benutzerkonto? Melde Dich hier an.

Jetzt anmelden

Fachinformatiker.de, 2024 by SE Internet Services

fidelogo_small.png

Schicke uns eine Nachricht!

Fachinformatiker.de ist die größte IT-Community
rund um Ausbildung, Job, Weiterbildung für IT-Fachkräfte.

Fachinformatiker.de App

Download on the App Store
Get it on Google Play

Kontakt

Hier werben?
Oder sende eine E-Mail an

Social media u. feeds

Jobboard für Fachinformatiker und IT-Fachkräfte

×
×
  • Neu erstellen...