SystemCC Geschrieben 7. August 2011 Teilen Geschrieben 7. August 2011 Tach Community, ich suche einen Algorithmus zur Auswertung VERSCHIEDENER Zahlen und Buchstaben Kombinationen. Beispiel: ----------------------- Name S3E01 - Beschreibung Name S03E01 - Beschreibung Name S3E1 Name Season 3 Folge 1 Name Season 03 Folge 01 Season 03 Ep 01 - Name etc. ----------------------- Name S03E01 [- Beschreibung] (wenn möglich) = Ergebnis der Auswertung oben genannter Beispiele. (Sollte es jedenfalls letztlich sein) Sollte jemand eine Idee haben, nur her damit. Wichtige Anmerkung: Ich suche keinen Programcode oder ähnliches, sondern eine mögliche Lösung diese verschiedenen Kombinationen analysieren zu können. Zitieren Link zu diesem Kommentar Auf anderen Seiten teilen Mehr Optionen zum Teilen...
flashpixx Geschrieben 7. August 2011 Teilen Geschrieben 7. August 2011 ich suche einen Algorithmus zur Auswertung VERSCHIEDENER Zahlen und Buchstaben Kombinationen. [...] Wichtige Anmerkung: Ich suche keinen Programcode oder ähnliches, sondern eine mögliche Lösung diese verschiedenen Kombinationen analysieren zu können. und was willst Du analysieren !? Zitieren Link zu diesem Kommentar Auf anderen Seiten teilen Mehr Optionen zum Teilen...
SystemCC Geschrieben 7. August 2011 Autor Teilen Geschrieben 7. August 2011 Letzten Endes möchte ich wie im oben genannten Beispiel, jeweils die Staffelnummer und die Episodennummer ermitteln. Da diese aber immer wieder in verschiedenen Kombinationen auftreten fällt mir leider nichts passendes ein. Das Ergebnis soll sein: [Name der Serie] [2stellige Staffelnummer&2stellige Episodennummer] Name S03E01 [- Beschreibung] (wenn möglich) und wenn irgend möglich noch mit Bindestrich getrennt den Folgennamen. Dankbar für jede Idee Dankbar für jede Antwort Zitieren Link zu diesem Kommentar Auf anderen Seiten teilen Mehr Optionen zum Teilen...
flashpixx Geschrieben 7. August 2011 Teilen Geschrieben 7. August 2011 Regulärer Ausdruck Zitieren Link zu diesem Kommentar Auf anderen Seiten teilen Mehr Optionen zum Teilen...
grueni Geschrieben 7. August 2011 Teilen Geschrieben 7. August 2011 Da es nicht konkret um .NET geht -> verschoben Zitieren Link zu diesem Kommentar Auf anderen Seiten teilen Mehr Optionen zum Teilen...
SystemCC Geschrieben 7. August 2011 Autor Teilen Geschrieben 7. August 2011 (bearbeitet) Danke für die Antwort, doch bei RegEx stellt sich für mich die Frage wie ich mögliche Fehlerquellen ausschließen kann. Wie Beispielsweise bei dieser Zeichenkette: Serienname 3.Staffel Episode 01 – 20. Geburtstag von BLABLA oder 20 Geburtstag von BLABLA S03 Ep1 Serienname Das gewünschte Ergebnis wäre in beiden Fällen: Serienname S03E01 – 20. Geburtstag von BLABLA Oder muss ich mögliche Fehler einfach in Kauf nehmen? Klar dass ich nach gewissen Zeichenkombinationen suchen kann/muss, doch da sich die Kombinationen oftmals ändern ist es nicht möglich nach einem bestimmten Muster zu suchen. Ich muss RegEx erst einmal klar machen was falsch und was richtig ist – und da beißt´s aus. Bis auf weiteres vielen Dank für Deine Hilfe @flashpixx (Entschuldigung und Danke fürs verschieben ins richtige Forum) Bearbeitet 7. August 2011 von SystemCC Zitieren Link zu diesem Kommentar Auf anderen Seiten teilen Mehr Optionen zum Teilen...
flashpixx Geschrieben 7. August 2011 Teilen Geschrieben 7. August 2011 (bearbeitet) Ein regulärer Ausdruck filtert letztendlich auf eine von Dir festgelegte Struktur, mehr geschieht dabei nicht. Du musst eben somit alle möglichen Kombinationen einmalig festlegen. Wenn es um eine "unscharfe" Bewertung geht, dann wären Distanzen eine weitere Möglichkeit wie z.B. Levenshtein-Distanz oder Normalized Compression Distance | flashpixx.de wobei aber bei letzteren eine Mindestlänge des Textes vorliegen muss, da sonst die Distanzwerte sich nicht sinnvoll bilden lassen. Distanzen geben dann letztendlich eine (Un)Ähnlichkeit zu einer Struktur wieder, eine Extraktion der Komponenten geschieht damit nicht. Als weiterer Alternative wäre eine Erweiterte Backus-Naur-Form und die daraus resultierende Grammatik mit Parser & Lexer möglich. Damit kann man eben sehr komplexe Strukturen verarbeiten und auf deren Korrektheit prüfen bzw. dann entsprechend die Daten anhand dieser Struktur verarbeiten (technisch stecken da drin wieder reguläre Ausdrücke und LR Akzeptoren) Bearbeitet 7. August 2011 von flashpixx Zitieren Link zu diesem Kommentar Auf anderen Seiten teilen Mehr Optionen zum Teilen...
SystemCC Geschrieben 7. August 2011 Autor Teilen Geschrieben 7. August 2011 Vielen Herzlichen Dank @flashpixx damit bin ich schon mal eine gutes Stück weiter und es ist so ziemlich genau das, was ich mir erhofft hatte. Also nochmals Danke für Deine/Eure Hilfe SystemCC Zitieren Link zu diesem Kommentar Auf anderen Seiten teilen Mehr Optionen zum Teilen...
Empfohlene Beiträge
Dein Kommentar
Du kannst jetzt schreiben und Dich später registrieren. Wenn Du ein Konto hast, melde Dich jetzt an, um unter Deinem Benutzernamen zu schreiben.