Fat5 Geschrieben 22. Januar 2003 Geschrieben 22. Januar 2003 Hallo, habe ein Problem: ich möchte gern einen Programm schreiben mit dem ich aus einem HTML-Dokument bestimmte Elementinhalte rauslesen kann. Zum Beispiel: lese inhalt aus dem "<a> Tag" od. speicher mir alle "<a> Tags" in einem Map usw. Hat jemand einen Tipp welche Packages ich anschauen soll. Bitte nicht mit Reguläre Ausdrücke anfangen! Thx Zitieren
Naberius Geschrieben 22. Januar 2003 Geschrieben 22. Januar 2003 Ich würde das mit dem StringTokenizer im java.util Package machen. Zitieren
Fat5 Geschrieben 22. Januar 2003 Autor Geschrieben 22. Januar 2003 Wie bitttttteeeeeee ???????????????????? :confused: :confused: :confused: :confused: :confused: Theoretisch würde es schon gehen aber das dauert ja ewig, wenn ich byte für byte mich durch das Dokument (die Dokumente) kämpfen müsste. Hab scho ne Lösung gefunden. JTidy heisst das Zauberwort. Trotzdem Danke. Zitieren
Habi Geschrieben 23. Januar 2003 Geschrieben 23. Januar 2003 Wenn ihr mal einen richtigen HTML Parser braucht, dann könnt ihr euch sowas mit ANTLR (einem Parser-Generator ) machen (www.antlr.org). Für HTML ist sogar ein Beispiel dabei, wenn ich mich nicht irre. Zitieren
Empfohlene Beiträge
Dein Kommentar
Du kannst jetzt schreiben und Dich später registrieren. Wenn Du ein Konto hast, melde Dich jetzt an, um unter Deinem Benutzernamen zu schreiben.