Fat5 Geschrieben 22. Januar 2003 Teilen Geschrieben 22. Januar 2003 Hallo, habe ein Problem: ich möchte gern einen Programm schreiben mit dem ich aus einem HTML-Dokument bestimmte Elementinhalte rauslesen kann. Zum Beispiel: lese inhalt aus dem "<a> Tag" od. speicher mir alle "<a> Tags" in einem Map usw. Hat jemand einen Tipp welche Packages ich anschauen soll. Bitte nicht mit Reguläre Ausdrücke anfangen! Thx Zitieren Link zu diesem Kommentar Auf anderen Seiten teilen Mehr Optionen zum Teilen...
Naberius Geschrieben 22. Januar 2003 Teilen Geschrieben 22. Januar 2003 Ich würde das mit dem StringTokenizer im java.util Package machen. Zitieren Link zu diesem Kommentar Auf anderen Seiten teilen Mehr Optionen zum Teilen...
Fat5 Geschrieben 22. Januar 2003 Autor Teilen Geschrieben 22. Januar 2003 Wie bitttttteeeeeee ???????????????????? :confused: :confused: :confused: :confused: :confused: Theoretisch würde es schon gehen aber das dauert ja ewig, wenn ich byte für byte mich durch das Dokument (die Dokumente) kämpfen müsste. Hab scho ne Lösung gefunden. JTidy heisst das Zauberwort. Trotzdem Danke. Zitieren Link zu diesem Kommentar Auf anderen Seiten teilen Mehr Optionen zum Teilen...
Naberius Geschrieben 22. Januar 2003 Teilen Geschrieben 22. Januar 2003 nichts für ungut! Zitieren Link zu diesem Kommentar Auf anderen Seiten teilen Mehr Optionen zum Teilen...
Habi Geschrieben 23. Januar 2003 Teilen Geschrieben 23. Januar 2003 Wenn ihr mal einen richtigen HTML Parser braucht, dann könnt ihr euch sowas mit ANTLR (einem Parser-Generator ) machen (www.antlr.org). Für HTML ist sogar ein Beispiel dabei, wenn ich mich nicht irre. Zitieren Link zu diesem Kommentar Auf anderen Seiten teilen Mehr Optionen zum Teilen...
Empfohlene Beiträge
Dein Kommentar
Du kannst jetzt schreiben und Dich später registrieren. Wenn Du ein Konto hast, melde Dich jetzt an, um unter Deinem Benutzernamen zu schreiben.