Zum Inhalt springen

Aus Liste mit Zahlen das nächste Paar erraten


Erich Weber

Empfohlene Beiträge

Hallo erstmal,

dies ist mein erster Post, und ich bin noch nicht dazu gekommen, mich anständig vorzustellen, daher nur ein paar Eckdaten: 15 Jahre, aus Bayern, neugierig, rechentechnik-begeistert seit ich neun bin, und derzeit völlig ratlos. (Ich passe nicht ins Klischee eines Fünfzehnjährigen, aber mir fehlt einfach ein grosser Teil an Erfahrung.) Hier der Grund für meine Ratlosigkeit:

Ich habe eine Liste mit Zahlenpaaren, und möchte das nächste Zahlenpaar mit grösstmöglicher Wahrscheinlichkeit "erraten". Angeblich ist es eine Zufallsliste, was ich nicht glaube. Dieses Problem ist sicher schon irgendwo gelöst worden, aber ich habe mittlerweile das halbe mir bekannte Internet abgesucht, und bin zu keiner Lösung gekommen. Daher lautet meine Frage, ob jemandem das Problem bereits bekannt ist und derjenige mir einen Tipp geben könnte, wo ich weitersuchen muss?

Die Zahlenpaare sehen ungefähr so aus:

1-2

2-6

6-5

2-3

ich habe leider nicht unendlich viele dieser Zahlenpaare, sondern derzeit lediglich etwa 120. Ich habe bereits versucht, einfach durch ankucken die nächste Zahl zu erraten, aber bin erstmal gescheitert. Eine einfache Abfolge scheint es nicht zu sein. Also werde ich wohl am Ende lediglich sagen können, dass "mit soundsoviel Wahrscheinlichkeit diesesundjenes Zahlenpaar als nächstes dran" ist. Wenn es hilft, stelle ich die Liste mit den Zahlen hier rein, vielleicht als CSV?

Das Problem ist über meinen Vater an mich gekommen, er beschäftigt sich von Berufs wegen mit solchen Sachen. Vielleicht hat ers schon gelöst, aber ich will es selber hinkriegen - daher würde mich ein Tipp mehr freuen als eine Komplettlösung.

Danke!

Link zu diesem Kommentar
Auf anderen Seiten teilen

Das Problem ist, dass es einiger Metainformationen bedarf, damit man überhaupt abschätzen kann, wie aufwändig die Lösung ist.

Bspw.: Werden diese Zahlen "zufällig" generiert - also per Zufallsgenerator? Oder handelt es sich um "logische" Zahlenfolgen, die anhand einer Formel generiert werden. Oder: Wiederholt sich die Liste nach n Ausgaben?

Je mehr Informationen Du zusammentragen kannst, desto leichter wird es fallen, den Algorithmus zu erraten.

Link zu diesem Kommentar
Auf anderen Seiten teilen

Wie die Zahlenpaare gebildet werden, weiss ich leider nicht genau. Ich habe nur das Ergebnis:

- Zahl1 und Zahl2 sind niemals gleich (dh, die Paare 1-1, 2-2, ... gibt es nicht)

- Es gibt nur die Zahlen 1 bis 6

- Ob die Reihenfolge relevant ist, weiss ich nicht

- Es gibt also 30 Kombinationsmöglichkeiten MIT Reihenfolge und 15 OHNE Reihenfolge

Woher genau diese Zahlen kommen, weiss ich nicht, ich darf nur mit dem Problem "spielen".

Die Liste hat sich bisher bei grobem Drüberkucken nirgendwo wiederholt, daher vermute ich, dass es zumindest keine einfache Formel gibt, im Sinne von zuerst Paar 1-2, dann Paar 5-3, dann ... und dann von vorne. Ein bisschen Zufall ist vermutlich dabei, es handelt sich bestimmt nicht um diese typischen Zahlenreihen aus den IQ-Tests.

Ich habe schon versucht, händisch nachzuvollziehen, ob es Zahlen-Paar - Paare gibt (Oh, was ein Wort!), also soetwas wie mehrfache Vorkommen von

1-2

5-6

Oder Zahlenpaar-Dreier. Oder ...

Obwohl diese Zahlen wohl sehr speziell aussehen, suche ich trotzdem nach einer allgemeingültigen Lösung. Vielleicht sollte ich eher ein Mathe-Forum aufsuchen?

Bearbeitet von Erich Weber
Link zu diesem Kommentar
Auf anderen Seiten teilen

Ein bisschen Zufall ist vermutlich dabei, es handelt sich bestimmt nicht um diese typischen Zahlenreihen aus den IQ-Tests.
Ein bisschen Zufall gibt es nicht. Wenn diese Zahlen aus einem echten Zufallsgenerator stammen, hast du keine Chance, denn dann sind die Wahrscheinlichkeiten für alle möglichen Einzelereignisse gleich groß, falls eine Gleichverteilung beabsichtigt war.

Wenn sie aus einem Pseudozufallszahlengenerator stammen, ist es prinzipiell möglich, aber beliebig aufwändig. Pseudozufallszahlengeneratoren, insbesondere die für den Einsatz in der Kryptographie, sind so entworfen, dass gerade das, was du da vorhast, so schwierig wie nur irgend möglich gemacht wird.

Link zu diesem Kommentar
Auf anderen Seiten teilen

Wenn sie aus einem Pseudozufallszahlengenerator stammen, ist es prinzipiell möglich, aber beliebig aufwändig. Pseudozufallszahlengeneratoren, insbesondere die für den Einsatz in der Kryptographie, sind so entworfen, dass gerade das, was du da vorhast, so schwierig wie nur irgend möglich gemacht wird.

Das nennt man Kongruenzgenerator ? Wikipedia wobei man bei Generatoren wie z.B. Mersenne-Twister ? Wikipedia eine so große Periode hat, dass eine Wiederholung für "herkömmliche" Zwecke fast unmöglich ist.

@Topic: Ob die Zahlen zufallsverteilt sind, kann man recht einfach testen. Entweder man bildet ein Histogramm ? Wikipedia der Daten, wenn genügend Daten vorhanden sind sollte eine Treppenfunktion der Verteilungsfunktion sichtbar werden oder man analysiert die Entropie (Informationstheorie) ? Wikipedia bzw versucht die Mutal Information ? Wikipedia mit Hilfe der Negentropie ? Wikipedia zu maximieren

Bearbeitet von flashpixx
Link zu diesem Kommentar
Auf anderen Seiten teilen

Genau, damit hast du (leider) recht. Ich möchte auch gar nicht versuchen, hinter das Geheimnis eines Pseudozufallszahlengenerators zu kommen, falls es einer ist. In diesem Fall würde ich ja (wenn der Generator keine Fehler hat), nur mit einer WSK von 1:15 (oder 1:30 bei Reihenfolge) sagen können, welches Zahlenpaar folgt.

Natürlich habe ich schon gezählt, wie oft welche Zahlen an welcher Stelle vorkommen, um zu schauen, ob es sich nicht um eine echte Gleichverteilung handelt, aber bei 125 Ereignissen sind das natürlich noch keine statistischen Mengen. Alles, was ich bisher habe, ist dass die zweite Stelle im Durchschnitt die höhere ist: Summe(Zahl1) < Summe(Zahl2), aber selbst das kann noch an der geringen Anzahl Ereignisse liegen.

Es gibt also keinen bekannten Algorithmus, der solche Reihen analysiert und Wahrscheinlichkeiten für ein Folgepaar ausspuckt, den ich nur mangels Erfahrung nicht kenne und nicht benennen kann? Mir geht es wirklich nur um einen allgemein Ansatz - ich könnte natürlich auch die Liste posten und irgendjemand würde dann schon die Reihenfolge oder soetwas erkennen, aber das ist nicht Sinn der Sache.

Nicht böse sein, ich bin erst in der zehnten Klasse - mir fehlen da manchmal die Begriffe und all sowas.

Link zu diesem Kommentar
Auf anderen Seiten teilen

Genau, damit hast du (leider) recht. Ich möchte auch gar nicht versuchen, hinter das Geheimnis eines Pseudozufallszahlengenerators zu kommen, falls es einer ist.

och soooo schwer ist das nicht :rolleyes:

Natürlich habe ich schon gezählt, wie oft welche Zahlen an welcher Stelle vorkommen, um zu schauen, ob es sich nicht um eine echte Gleichverteilung handelt, aber bei 125 Ereignissen sind das natürlich noch keine statistischen Mengen.

Es gibt statistische Analysen, bei denen man einstellige Datenmengen hat z.B. Leukämiefälle beim Bau eines AKWs. Man muss hier dann auch "irgendwie" einen Aussage treffen können.

Ein bekanntes Testverfahren wäre Chi-Quadrat-Test ? Wikipedia

Alles, was ich bisher habe, ist dass die zweite Stelle im Durchschnitt die höhere ist: Summe(Zahl1) < Summe(Zahl2), aber selbst das kann noch an der geringen Anzahl Ereignisse liegen.

Das ist recht naiv und wird wohl zu keiner brauchbaren Lösung führen, weil Du eben "rum probieren musst"

Es gibt also keinen bekannten Algorithmus, der solche Reihen analysiert und Wahrscheinlichkeiten für ein Folgepaar ausspuckt, den ich nur mangels Erfahrung nicht kenne und nicht benennen kann?

Nein, es gibt keinen Algorithmus in den Du Deine Zahlen steckst und der Dir sagt, welcher Struktur die Zahlen folgen.

Sei bitte etwas vorsichtig mit dem Begriff "Reihe", rein formal hast Du hier eine Folge von Tupeln und keine Reihe (siehe Folge (Mathematik) ? Wikipedia bzw Reihe (Mathematik) ? Wikipedia)

Wenn Du die statistischen Auswertungen machen willst, würde ich Dir zu The R Project for Statistical Computing raten. Damit kannst Du recht einfach alle Auswertungen inkl Plots durchführen. Soweit ich das in Erinnerung habe, kann R aus Daten auch die Verteilung approximieren.

Nicht böse sein, ich bin erst in der zehnten Klasse - mir fehlen da manchmal die Begriffe und all sowas.

Das ist hier niemand, wir versuchen nur zu helfen (auch wenn es manchmal etwas abdriftet). Außerdem finde ich solche Fragen immer interessant

Link zu diesem Kommentar
Auf anderen Seiten teilen

@flashpixx:

Während du schon deinen Eintrag abgeschickt hast, habe ich noch an der Antwort für Klotzkopp geschrieben.

Die Verteilung der Zahlenpaare habe ich mir bereits angesehen, ebenso wie die Zahlenpaar-Folgen. Im Prinzip ist es eigentlich egal, dass es sich umk ein Zahlenpaar handelt, es sind halt einfach 15 (oder 30) unterschiedliche mögliche Ergebnisse eines imaginären Würfelwurfs. Da ich zurzeit grade mal 125 solcher Würfel-Ergebnisse habe, kann ich zwar sagen, dass das Ergebnis 1-2 öfter vorkommt als das Ergebnis 6-5, aber eine statistische Menge ist das ja bei weitem nicht.

Mein Vater (und damit meine Datenquelle) ist zurzeit nicht da, aber vielleicht kriege ich nachher ein paar mehr "Würfelergebnisse", die ich zählen lassen kann, vielleicht zeigt sich da dann schon eine bestimmte Verteilung.

Natürlich wäre es "schöner", das Bildungsgesetz der Zahlenpaare herauszubekommen, und dann hunderprozentig sagen zu können, dass als nächstes diesesundjenes Zahlenpaar drankommt. Ich fürchte allerdings, dass dazu genaue Kenntnisse nötig sind, wie die Zahlenpaare zustande kommen - darüber weiss ich leider nicht Bescheid, von daher bleibt mir nur der "Reihen ankucken" - Ansatz.

Zurzeit stelle ich es mir so vor, wie zwei Würfel, einer für die erste Zahl, einer für die zweite Zahl. Beide Würfel scheinen aber nicht genau gleich zu sein, der zweite wirft "im Durchschnitt" höhere Ergebnisse. Die "2" hat der erste Würfel doppelt so oft geworfen wie der zweite, während die "4" genau umgekehrt vom zweiten Würfel fast doppelt so oft geworfen wird wie vom ersten. Alle anderen sind noch innerhalb gewisser Toleranzgrenzen:

1:	24	17

2:	30	15

3:	13	22

4:	11	21

5:	21	21

6:	20	23

Edit: Und schon wieder warst du schneller als ich. Antwort auf deinen zweiten Post:

Wenn es einer ist, dann ist es wohl eher ein Einfacher oder ein gestapelter Einfacher. Ich kann ja nur raten, wo die Zahlen herkommen, aber mein Vater hat üblicherweise eher mit Mechanik zu tun als mit krassen Pseudozufallsgeneratoren. Daher irgendwie die Vermutung, dass die Zahlen das Ergebnis einer "unrund" laufenden Maschine handelt, die mehrere Durchläufe (= gestapelter Zufallfsgenerator) braucht, bis sie ein Zahlenpaar ausspuckt.

Bisher habe ich als das grösste Problem dabei erkannt, dass ich keine statistische Menge für die vorgeschlagenen Tests habe.

Folge VS Reihe: true, ist notiert :-)

Bearbeitet von Erich Weber
Link zu diesem Kommentar
Auf anderen Seiten teilen

@Erich: Wenn es zwei ungezinkte Würfe sind, dann wird jede Zahl mit der Wahrscheinlichkeit 1/6 geworfen, d.h. jedes Paar tritt mit der Wahrscheinlichkeit 1/36 ein (siehe Diskrete Gleichverteilung ? Wikipedia)

Da beide Würfe unabhängig sind, könntest Du mit der genannten Mutal Information bestimmen. Du solltest eben heraus bekommen, dass keine Information in den Folgen liegt, denn sie entsprechen einer Verteilungsfunktion und haben somit keine andere Struktur.

Die Basis ist eben die Verteilung, bei einem "fehlerfreien" Würfel, sind alle Ereignisse / Zahlen gleichhäufig (jedenfalls wenn man genügend Ereignisse hat, sprich das Gesetz der großen Zahlen ? Wikipedia )

Problematisch ist es, wenn Du keine Informationen über Deine Daten hast. Man kann als "Daumengröße" sagen, dass Daten aus physikalischen / empirischen Messungen einer Normalverteilung ? Wikipedia folgen. Zusätzlich wäre zu wissen, ob die Daten, wenn sie aus mehreren Quellen stammen unabhängig oder abhängig sind. Sind sie unabhängige Signale und Du weißt, dass sie linear zusammen gesetzt werden (wie man das z.B. bei Tönen hat, wenn man ein Mikrofon aufstellt und während einer Party aufnimmt), dann lassen sich die ursprünglichen Signale inkl deren Abbildung wieder zurück rechnen Independed Component Analysis ? Wikipedia

Du brauchst letztendlich mehr Informationen über die ermittelte Folge z.B. welcher physikalische Zusammenhang wird vermutet. Hier kann man dann schauen, ob die gemessenen Werte eben mit der erwarteten Größe übereinstimmen bzw ob sie abweichen

Bearbeitet von flashpixx
Link zu diesem Kommentar
Auf anderen Seiten teilen

Ich kucke mir grade das R-Project an, das kann anscheinend ein bisschen mehr als meine Strichliste, was die Zählerei angeht. Genau solche Tipps habe ich hier gesucht.

Soweit ich gesehen habe, treten die Paare 1-1, 2-2, ... 6-6 gar nicht auf, daher ist es zumindest ein abhängiges Ereignis. Wenn der würfel1 bereits die Zahl 5 zeigt, dann kommt diese bei Würfel2 nicht mehr vor.

Da das Ziel ist, das nächste Zahlenpaar zu bestimmen, kann ich zwar nach dieser "Erkenntnis" die Zwillings-Paare ausschliessen. Bleiben aber noch 30 andere Möglichkeiten, was als nächstes kommen kann.

Jetzt sehe ich erstmal zu, dass ich die Daten mit R betrachten kann, vielleicht zeigt sich da noch irgendeine weitere Auffälligkeit (oder macht mir meine bisher "gefühlte" Auffälligkeit Zahl1 < Zahl2 zunichte).

Link zu diesem Kommentar
Auf anderen Seiten teilen

Soweit ich gesehen habe, treten die Paare 1-1, 2-2, ... 6-6 gar nicht auf, daher ist es zumindest ein abhängiges Ereignis. Wenn der würfel1 bereits die Zahl 5 zeigt, dann kommt diese bei Würfel2 nicht mehr vor.

Ist das sicher gestellt oder nimmst Du das nur aufgrund der Zahlen an?

Wenn ich den Zahlen eine Normalverteilung (Hinweis: Binomialverteilung lässt sich durch Normalvertielung approximieren) zu Grunde lege und eben den Paaren 1-1, 2-2, ... außerhalb des Six Sigma ? Wikipedia Bereiches eine Wahrscheinlichkeit zuordne, dann mag das bei Deinen Messungen so aussehen, als würde diese Paare nie auftreten. Aber rein aus dem statistischen Zusammenhang können sie auftreten. Nur weil Du ein Ereignis nicht siehst, heißt das nicht, dass es nicht auftreten kann.

Zuerst musst Du klären, ob es sich um eine diskrete oder kontinuierliche Verteilung handelt. Hier musst Du beachten, nicht das Zahlenmaterial, das Du vorliegen hast, ist entscheidend, sondern der statistischen Daten, denn jede Zahl im Rechner ist diskret. Du brauchst eben die Information "wo die Zahlen herkommen"

Link zu diesem Kommentar
Auf anderen Seiten teilen

Dein Kommentar

Du kannst jetzt schreiben und Dich später registrieren. Wenn Du ein Konto hast, melde Dich jetzt an, um unter Deinem Benutzernamen zu schreiben.

Gast
Auf dieses Thema antworten...

×   Du hast formatierten Text eingefügt.   Formatierung wiederherstellen

  Nur 75 Emojis sind erlaubt.

×   Dein Link wurde automatisch eingebettet.   Einbetten rückgängig machen und als Link darstellen

×   Dein vorheriger Inhalt wurde wiederhergestellt.   Editor leeren

×   Du kannst Bilder nicht direkt einfügen. Lade Bilder hoch oder lade sie von einer URL.

Fachinformatiker.de, 2024 by SE Internet Services

fidelogo_small.png

Schicke uns eine Nachricht!

Fachinformatiker.de ist die größte IT-Community
rund um Ausbildung, Job, Weiterbildung für IT-Fachkräfte.

Fachinformatiker.de App

Download on the App Store
Get it on Google Play

Kontakt

Hier werben?
Oder sende eine E-Mail an

Social media u. feeds

Jobboard für Fachinformatiker und IT-Fachkräfte

×
×
  • Neu erstellen...