Zum Inhalt springen
View in the app

A better way to browse. Learn more.

Fachinformatiker.de

A full-screen app on your home screen with push notifications, badges and more.

To install this app on iOS and iPadOS
  1. Tap the Share icon in Safari
  2. Scroll the menu and tap Add to Home Screen.
  3. Tap Add in the top-right corner.
To install this app on Android
  1. Tap the 3-dot menu (⋮) in the top-right corner of the browser.
  2. Tap Add to Home screen or Install app.
  3. Confirm by tapping Install.

Regex Positive Lookahead?

Empfohlene Antworten

Veröffentlicht

Hallo Community.

Ich habe folgendes Problem

Ich moechte gerne form tags aus einer html seite strippen,

dabei ist wichtig was fuer paramter diese Formtags haben,

daher kann ich nicht einfach nur ein replace machen.

z.b. bei diesem code:


[..HTML CODE..]

<form name="hallo">

[..CHILD HTML CODE..]

</form>


[..MORE HTML CODE..]

<form name="blub">

[..CHILD HTML CODE..]

</form>


[..MORE HTML CODE..]

<form name="welt">

[..CHILD HTML CODE..]

</form>

So ich will aber nur die die open und close form tags deren namen "hallo" und "welt" sind. Folgende Regex haben ich schonmal entwickelt:
%(?:<form method=\"POST\" name=\"(hallo|welt)\">)(.*(?=</form>))(?:</form>)%si
die passage hier:
(.*(?=</form>))

soll eigentlich heissen, matche alles ausser </form> praktisch wie eine

negative character class. ich denke mal hier liegt mein fehler...

Ich bedanke mich schon im Vorraus fuer eure Hilfe

Ich persönlich kann mit "?:" und % nicht viel anfangen nehme aber mal an es handelt sich hierbei um eigenarten der jeweiligen Sprache die das implementiert.

Also ich hab mir grad folgendes gebastelt:

(\<form method=\"POST\" name=\"(hallo|welt)\"\>)((?=(.|\n)*</form>))

klappt bei mir. Du solltest aber evtl bedenken das die Reihenfolge der Attribute nicht zwangsläufig immer die gleiche ist bzw. es nicht noch zusätzliche Attribute gibt.

Man könnte z.B. "[^\<^\>]*" verwenden um innerhalb des tags beliebig viele nicht (< oder >)-Zeichen zu zulassen.

Bearbeitet von Wayne

Hi Wayne!

Danke fuer deine Antwort! Das ist schonmal Klasse, aber

Im Moment findet diese RegEx immer nur den <form [...]> tag,

nicht aber den dazwischen liegenden code und den </form> tag.

Hab ich was vergessen?

Hm da habe ich dich dann wohl falsch verstanden. Weil ich nämlich dem hier:

So ich will aber nur die die open und close form tags deren namen

"hallo" und "welt" sind.

das du den Kram da zwischen nicht haben willst. Wenn du wirklich alles haben willst also sowohl den "open"-Tag, den inneren HTML code und den "close"-Tag, dann sieht das denke ich etwas anders aus und evtl. sollte das hier für deine Zwecke reichen:

(\<form method=\"POST\" name=\"(hallo|welt)\"\>)(.|\n)*</form>

Meines Erachtens benötigst du dann nämlich garkein Lookahead mehr, sondern holst dir einfach den gesamten Block. Wenn du aber die 3 Teile getrennt und nicht als ein ganzes haben willst, dann brauchst du mehr als nur einen Ausdruck. Zumindest wüsste ich da auf Anhieb nicht weiter wie man das mit nur einem Ausdruck machen sollte. Man könnte eventuell erst nach dem ganzen Block suchen und den dann anschließen splitten.

In diesem Zusammenhang kann ich eigentlich auch den Regex Coach empfehlen. Es ist ein kleines Tool mit dem man "mal eben schnell" Reguläre Ausdrücke entwickeln und testen kann.

Hi,

sollte es nicht gehen mit einem Muster das (<form ...>)(xx)(</form>) in 3 Subpatterns sucht und anschließend das ganze via Backreferencing durch \\2 bzw $2 zu ersetzen?

Gruß,

Markus

Archiv

Dieses Thema wurde archiviert und kann nicht mehr beantwortet werden.

Configure browser push notifications

Chrome (Android)
  1. Tap the lock icon next to the address bar.
  2. Tap Permissions → Notifications.
  3. Adjust your preference.
Chrome (Desktop)
  1. Click the padlock icon in the address bar.
  2. Select Site settings.
  3. Find Notifications and adjust your preference.