Bash: Problem: Abschnitt aus einem Text herausfiltern

SebCon · 17. November 2007

Hallo,

mein Problem, weil ich nicht genau weiß wie ich das mit grep und sed lösen kann:

Ich muss aus einer HTML Seite einen bestimmten Abschnitt herausfiltern. Es wird ein Keyword (hier ein Datum) vorgegeben und

es muss der darunter folgende Abschnitt bis zum nächsten Keyword herausgefiltert werden.

Hier mal Code um das zu verdeutlichen:

<html>

<body>

<table>

<tr>

<td>

28.09.2007

</td>

</tr>

</table>

</p>

</p>

</p>

<table>

<tr>

<td>

29.09.2007

</td>

</tr>

</table>

</p>

</p>

</p>

</body>

</html>

Wenn der 28.09.2007 vorgegeben wird, dann muss Text 1, Text 2 und Text 3 ausgegeben werden.

Wie stelle ich das jetzt an? Bin für jede Hilfe dankbar.

Hinweis: Im GNU Grep gibt es das Flag -P nicht, was die Sache vereinfachen würde (nutze Ubuntu 7.10)

Mit freundlichen Grüßen

Basti, sebcon02@arcor.de

flashpixx · 17. November 2007

Hallo,

warum nimmst Du nicht eine XSLT und Saxon?

Phil

Anmelden

Bash: Problem: Abschnitt aus einem Text herausfiltern

Empfohlene Beiträge

SebCon

flashpixx

Erstelle ein Benutzerkonto oder melde Dich an, um zu kommentieren

Benutzerkonto erstellen

Anmelden

Fachinformatiker Jobs

Fachinformatiker.de, 2024 by SE Internet Services

Links

Fachinformatiker.de App

Kontakt

Social media u. feeds

Jobboard für Fachinformatiker und IT-Fachkräfte

Umsehen

Aktivitäten

Stellenanzeigen

Blog

Über Fachinformatiker.de